Como obter esparsamente apenas um único arquivo de um repositório git?
21 answers
Originalmente, eu mencionei em 2012 git archive
(consulte Jared Forsyth's resposta e Robert Knight's resposta), pois git1.7.9.5 (Março de 2012), Paul Brannan's resposta:
git archive --format=tar --remote=origin HEAD:path/to/directory -- filename | tar -O -xf -
Mas: em 2013, isso já não era possível para remotos https://github.com URLs .
Veja a página antiga " posso arquivar um repositório?"
A actual Página (2018) " sobre arquivar conteúdos e dados sobre o GitHub " recomenda a utilização de serviços de terceiros como GHTorrent ou GH Archive .
Para que também possa lidar com cópias/Clones locais:
Pode, em alternativa, fazer o seguinte se tiver uma cópia local do repositório bare, tal como mencionado em esta resposta,
git --no-pager --git-dir /path/to/bar/repo.git show branch:path/to/file >file
Ou tens de clonar primeiro o repo, o que significa que tens a história completa.: - no .git repo - no trabalho arvore.
-
mas depois podes fazer um saída esparsa (Se estiver a utilizar Git1. 7+),:
- activar a opção de saída esparsa(
git config core.sparsecheckout true
) - adicionando o que quer ver no ficheiro
.git/info/sparse-checkout
- reler a árvore de trabalho para mostrar apenas o que precisa
- activar a opção de saída esparsa(
Para reler a árvore de trabalho:
$ git read-tree -m -u HEAD
Dessa forma, você acaba com uma árvore de trabalho, incluindo precisamente o que você quer (mesmo que seja apenas um file)
Richard Gomes pontos ( nos comentários {[[11]}) para " como é que eu clono, obtenho ou escasso um único directório ou uma lista de directórios do repositório git?"
Uma função bash que evita descarregar o histórico, que recupera um único ramo e que recupera uma lista de ficheiros ou directórios de que necessita.
Primeiro clone o repo com a opção-n, que suprime a saída por omissão de todos os ficheiros, e a opção --depth 1, o que significa que só obtém a revisão mais recente de cada ficheiro
git clone -n git://path/to/the_repo.git --depth 1
Então confira apenas o arquivo que você quer assim:
cd the_repo
git checkout HEAD name_of_file
Se já tiver uma cópia do Acordo de recompra do git, poderá sempre obter uma versão de um ficheiro que utilize um git log
para descobrir o ID do hash (por exemplo, 3cdc61015724f9965575ba954c8cd4232c8b42e4) e então poderá simplesmente escrever:
git checkout hash-id path-to-file
Aqui está um exemplo real:
git checkout 3cdc61015724f9965575ba954c8cd4232c8b42e4 /var/www/css/page.css
Normalmente não é possível baixar apenas um arquivo de git
sem baixar todo o repositório, como sugerido na primeira resposta.
É porque o Git não armazena arquivos como você pensa (como CVS/SVN faz), mas gera-os com base em toda a história do projeto.
user
, project
, branch
, filename
.
GitHub
wget https://raw.githubusercontent.com/user/project/branch/filename
GitLab
wget https://gitlab.com/user/project/raw/branch/filename
GitWeb
Se estiver a usar Git no servidor-GitWeb , então poderá tentar no exemplo (alterá-lo para o caminho certo):
wget "http://example.com/gitweb/?p=example;a=blob_plain;f=README.txt;hb=HEAD"
GitWeb at drupalcode.org
Exemplo:
wget "http://drupalcode.org/project/ads.git/blob_plain/refs/heads/master:/README.md"
Googlesource.com
Existe uma funcionalidade não documentada que lhe permite baixar as versões codificadas do raw em base64 ficheiros:
curl "https://chromium.googlesource.com/chromium/src/net/+/master/http/transport_security_state_static.json?format=TEXT" | base64 --decode
Noutros casos, verifique se o seu repositório Git está a usar quaisquer interfaces web.
Se não estiver a usar qualquer interface web, pode considerar enviar o seu código para serviços externos como GitHub, Bitbucket, etc . e usá-lo como um espelho.
Se não tiver wget
instalado, tente curl -O (url)
Em alternativa.
Guia Mínimo
git checkout -- <filename>
Ref: https://git-scm.com/docs/git-checkout
Dup: desfazer as modificações da cópia de trabalho de um ficheiro no Git?
Git checkout branch_ or_version -- path / file
Exemplo:git checkout HEAD -- main.c
Agora podemos!Como este é o primeiro resultado no google, pensei em Actualizar isto para a última posição. Com o advento do git 1.7.9.5, temos o comando git archive
que lhe permitirá recuperar um único arquivo de um host remoto.
git archive --remote=git://git.foo.com/project.git HEAD:path/in/repo filename | tar -x
Veja a resposta completa aqui https://stackoverflow.com/a/5324532/290784
Trabalhar no GIT 1.7.2.2
Por exemplo, você tem um controle remoto some_remote, com ramos branch1, branch32
Para obter um ficheiro específico, você chama a isto comandos:
git checkout remote/branch path/to/file
Como exemplo, será algo como isto
git checkout some_remote/branch32 conf/en/myscript.conf
git checkout some_remote/branch1 conf/fr/load.wav
Este comando de saída irá copiar toda a estrutura de ficheiros conf / en e conf / fr para a pasta actual, onde você chama estes comandos (claro que assumo que você executou o git init em algum momento antes)
Muito simples:
git checkout from-branch-name -- path/to/the/file/you/want
Isto não vai verificar o ramo from-branch-name
. Você vai ficar em qualquer branch que você está, e apenas esse único arquivo será verificado a partir do branch especificado.
git-checkout
git checkout [-p|--patch] [<tree-ish>] [--] <pathspec>...
When <paths> or --patch are given, git checkout does not switch
branches. It updates the named paths in the working tree from the
index file or from a named <tree-ish> (most often a commit). In
this case, the -b and --track options are meaningless and giving
either of them results in an error. The <tree-ish> argument can be
used to specify a specific tree-ish (i.e. commit, tag or tree) to
update the index for the given paths before updating the working
tree.
Gorjetas para Ariejan de Vroom que me ensinou isso a partir deste postblog post .
git clone --filter
do Git 2.19
Esta opção irá de facto saltar a obtenção da maioria dos objectos sem necessidade do servidor:
git clone --depth 1 --no-checkout --filter=blob:none \
"file://$(pwd)/server_repo" local_repo
cd local_repo
git checkout master -- mydir/myfile
O servidor deve ser configurado com:
git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1
Não existe suporte de servidor a partir de v2. 19. 0, mas já pode ser testado localmente.
TODO: --filter=blob:none
Salta todas as bolhas, mas ainda Apanha todos os objectos das árvores. Mas em um repo normal, este deve ser minúsculo em comparação com os arquivos em si, então isso já é bom o suficiente. Perguntado em: https://www.spinics.net/lists/git/msg342006.html Devs respondeu que um --filter=tree:0
está em obras para fazer isso.
Lembre-se que --depth 1
já implica --single-branch
, Veja também: Como é que clono um único ramo no Git?
file://$(path)
é necessário ultrapassar git clone
as brincadeiras do protocolo: Como clonar um repositório de git local com um caminho relativo?
O formato de --filter
está documentado em man git-rev-list
.
Foi feita uma extensão ao protocolo Git remote para apoiar este recurso.
Docs on Git tree:
- https://github.com/git/git/blob/v2.19.0/Documentation/technical/partial-clone.txt
- https://github.com/git/git/blob/v2.19.0/Documentation/rev-list-options.txt#L720
- https://github.com/git/git/blob/v2.19.0/t/t5616-partial-clone.sh
Teste-o
#!/usr/bin/env bash
set -eu
list-objects() (
git rev-list --all --objects
echo "master commit SHA: $(git log -1 --format="%H")"
echo "mybranch commit SHA: $(git log -1 --format="%H")"
git ls-tree master
git ls-tree mybranch | grep mybranch
git ls-tree master~ | grep root
)
# Reproducibility.
export GIT_COMMITTER_NAME='a'
export GIT_COMMITTER_EMAIL='a'
export GIT_AUTHOR_NAME='a'
export GIT_AUTHOR_EMAIL='a'
export GIT_COMMITTER_DATE='2000-01-01T00:00:00+0000'
export GIT_AUTHOR_DATE='2000-01-01T00:00:00+0000'
rm -rf server_repo local_repo
mkdir server_repo
cd server_repo
# Create repo.
git init --quiet
git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1
# First commit.
# Directories present in all branches.
mkdir d1 d2
printf 'd1/a' > ./d1/a
printf 'd1/b' > ./d1/b
printf 'd2/a' > ./d2/a
printf 'd2/b' > ./d2/b
# Present only in root.
mkdir 'root'
printf 'root' > ./root/root
git add .
git commit -m 'root' --quiet
# Second commit only on master.
git rm --quiet -r ./root
mkdir 'master'
printf 'master' > ./master/master
git add .
git commit -m 'master commit' --quiet
# Second commit only on mybranch.
git checkout -b mybranch --quiet master~
git rm --quiet -r ./root
mkdir 'mybranch'
printf 'mybranch' > ./mybranch/mybranch
git add .
git commit -m 'mybranch commit' --quiet
echo "# List and identify all objects"
list-objects
echo
# Restore master.
git checkout --quiet master
cd ..
# Clone. Don't checkout for now, only .git/ dir.
git clone --depth 1 --quiet --no-checkout --filter=blob:none "file://$(pwd)/server_repo" local_repo
cd local_repo
# List missing objects from master.
echo "# Missing objects after --no-checkout"
git rev-list --all --quiet --objects --missing=print
echo
echo "# Git checkout fails without internet"
mv ../server_repo ../server_repo.off
! git checkout master
echo
echo "# Git checkout fetches the missing file from internet"
mv ../server_repo.off ../server_repo
git checkout master -- d1/a
echo
echo "# Missing objects after checking out d1/a"
git rev-list --all --quiet --objects --missing=print
Saída no Git v2.19.0:
# List and identify all objects
c6fcdfaf2b1462f809aecdad83a186eeec00f9c1
fc5e97944480982cfc180a6d6634699921ee63ec
7251a83be9a03161acde7b71a8fda9be19f47128
62d67bce3c672fe2b9065f372726a11e57bade7e
b64bf435a3e54c5208a1b70b7bcb0fc627463a75 d1
308150e8fddde043f3dbbb8573abb6af1df96e63 d1/a
f70a17f51b7b30fec48a32e4f19ac15e261fd1a4 d1/b
84de03c312dc741d0f2a66df7b2f168d823e122a d2
0975df9b39e23c15f63db194df7f45c76528bccb d2/a
41484c13520fcbb6e7243a26fdb1fc9405c08520 d2/b
7d5230379e4652f1b1da7ed1e78e0b8253e03ba3 master
8b25206ff90e9432f6f1a8600f87a7bd695a24af master/master
ef29f15c9a7c5417944cc09711b6a9ee51b01d89
19f7a4ca4a038aff89d803f017f76d2b66063043 mybranch
1b671b190e293aa091239b8b5e8c149411d00523 mybranch/mybranch
c3760bb1a0ece87cdbaf9a563c77a45e30a4e30e
a0234da53ec608b54813b4271fbf00ba5318b99f root
93ca1422a8da0a9effc465eccbcb17e23015542d root/root
master commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
mybranch commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
040000 tree b64bf435a3e54c5208a1b70b7bcb0fc627463a75 d1
040000 tree 84de03c312dc741d0f2a66df7b2f168d823e122a d2
040000 tree 7d5230379e4652f1b1da7ed1e78e0b8253e03ba3 master
040000 tree 19f7a4ca4a038aff89d803f017f76d2b66063043 mybranch
040000 tree a0234da53ec608b54813b4271fbf00ba5318b99f root
# Missing objects after --no-checkout
?f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb
?308150e8fddde043f3dbbb8573abb6af1df96e63
# Git checkout fails without internet
fatal: '/home/ciro/bak/git/test-git-web-interface/other-test-repos/partial-clone.tmp/server_repo' does not appear to be a git repository
fatal: Could not read from remote repository.
Please make sure you have the correct access rights
and the repository exists.
# Git checkout fetches the missing directory from internet
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.
# Missing objects after checking out d1
?f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb
Conclusões: faltam todas as bolhas, excepto d1/a
. Por exemplo, f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
, que é d1/b
, não está lá depois de sair d1/
.
Note que root/root
e mybranch/mybranch
também estão em falta, mas --depth 1
esconde isso da lista de ficheiros em falta. Se você remover --depth 1
, então eles aparecem na lista de arquivos em falta.
Duas variantes do que já foi dado:
git archive --format=tar --remote=git://git.foo.com/project.git HEAD:path/to/directory filename | tar -O -xf -
E:
git archive --format=zip --remote=git://git.foo.com/project.git HEAD:path/to/directory filename | funzip
Estes escrevem o ficheiro para o resultado padrão.
Podes fazê-lo até
git archive --format=tar --remote=origin HEAD | tar xf -
git archive --format=tar --remote=origin HEAD <file> | tar xf -
git checkout --theirs 123.txt
Se o ficheiro estiver dentro de uma pasta A, certifique-se de O especificar correctamente:
git checkout --theirs "A/123.txt"
Aqui está a solução completa para puxar e empurrar apenas um ficheiro em particular dentro do repositório git:
- primeiro precisa de clonar o repositório git com uma dica especial - sem saída
git clone --no-checkout <git url>
- o próximo passo é livrar-se dos ficheiros não localizados no índice com o comando:
git reset
- agora é-lhe permitido começar a extrair os ficheiros que deseja alterar com o comando:
git checkout origin/master <path to file>
- Agora a pasta do repositório contém os ficheiros que você poderá comece a editar imediatamente. Após a edição, você precisa executar uma sequência simples e familiar de comandos.
git add <path to file>
git commit -m <message text>
git push
No git você não faz' checkout ' arquivos antes de atualizá - los - parece que isso é o que você está procurando.
Muitos sistemas como o clearcase, csv e assim por diante requerem que você 'checkout' um arquivo antes que você possa fazer alterações a ele. O Git não precisa disto. Você clonar um repositório e, em seguida, fazer alterações em sua cópia local do repositório.
Assim que actualizar os ficheiros, poderá fazer:
git status
Para ver que ficheiros foram modificados. Você adiciona os que deseja comprometer para index
primeiro com (index
é como uma lista a ser verificada):
git add .
Ou
git add blah.c
Depois do git status
mostrar-lhe-á quais os ficheiros que foram modificados e quais os que estão em index
prontos para serem iniciados ou verificados.
Para enviar os ficheiros para a sua cópia do repositório, Faça:
git commit -a -m "commit message here"
Ver git
sítio web para ligações a manuais e guias.
git clone /path/to/repo
git clone git://url/of/repo
git clone http://url/of/repo
Se precisar de um ficheiro específico de um ramo específico de um repositório remoto de Git, o comando é:
git archive --remote=git://git.example.com/project.git refs/heads/mybranch path/to/myfile |tar xf -
O resto pode ser derivado da resposta de @VonC:
Se precisar de um ficheiro específico do ramo principal é:
git archive --remote=git://git.example.com/project.git HEAD path/to/myfile |tar xf -
Se precisar de um ficheiro específico de uma marca, é:
git archive --remote=git://git.example.com/project.git mytag path/to/myfile |tar xf -
A minha situação, eu tenho um repositório remoto de talvez 10.000 arquivos e eu preciso construir um arquivo RPM para o meu sistema Linux. A construção do RPM inclui um clone git de tudo. Só preciso de um ficheiro para começar a construção do RPM. Eu posso clonar toda a árvore fonte que faz o que eu preciso, mas leva mais dois minutos para baixar todos esses arquivos quando tudo o que eu preciso é um. I tentei usar a opção de arquivo GIT discutida e fiquei "fatal: operação não suportada pelo protocolo."Parece que eu tenho que obter algum tipo de opção de arquivo ativado no servidor e meu servidor é mantido por bandidos burocráticos que parecem gostar de tornar difícil fazer as coisas feitas.
O que eu finalmente fiz foi entrar na interface web da bitbucket e ver o único arquivo que eu precisava. Eu fiz um clique direito sobre o link para baixar uma cópia raw do arquivo e selecionado "Copiar atalho" de o popup resultante. Eu não poderia simplesmente baixar o arquivo raw porque eu precisava automatizar as coisas e eu não tenho uma interface de navegador no meu servidor Linux.Para o bem da discussão, isso resultou na URL:
https://ourArchive.ourCompany.com/projects/ThisProject/repos/data/raw/foo/bar.spec?at=refs%2Fheads%2FTheBranchOfInterest
Não consegui descarregar directamente este ficheiro do repositório de bitbucket porque precisava de assinar primeiro. Depois de um pouco de pesquisa, encontrei isto a funcionar.: No Linux:
echo "myUser:myPass123"| base64
bXlVc2VyOm15UGFzczEyMwo=
curl -H 'Authorization: Basic bXlVc2VyOm15UGFzczEyMwo=' 'https://ourArchive.ourCompany.com/projects/ThisProject/repos/data/raw/foo/bar.spec?at=refs%2Fheads%2FTheBranchOfInterest' > bar.spec
Esta combinação permitiu-me descarregar o único ficheiro de que precisava para construir tudo. mais.
Estou a adicionar esta resposta como uma alternativa a fazer um check-out formal ou uma operação local semelhante. Assumindo que você tem acesso à interface web do seu provedor de Git, você pode ser capaz de visualizar diretamente qualquer arquivo em um determinado commit desejado. Por exemplo, no GitHub você pode usar algo como:
https://github.com/hubotio/hubot/blob/ed25584f/src/adapter.coffee
Aqui ed25584f
estão os primeiros 8 caracteres do hash SHA - 1 do commit of interest, seguido pelo caminho para o ficheiro de código.
Similarmente, em Bitbucket nós podemos tente:
https://bitbucket.org/cofarrell/stash-browse-code-plugin/src/06befe08
Neste caso, colocamos o hash de commit no final do URL de origem.
Se você só precisa baixar o arquivo, não precisa verificar com o Git.
Github Mate é muito mais fácil de fazer isso, é uma extensão Chrome, permite que você clique no ícone de arquivo para baixá-lo. também Código Aberto
Se editou uma versão local de um ficheiro e deseja voltar à versão original mantida no servidor central, isto pode ser facilmente conseguido usando As Extensões git.
- inicialmente o ficheiro será marcado para envio, uma vez que foi modificado
- seleccione (duplo-click) o ficheiro no menu árvore de ficheiros
- a árvore de revisão para o ficheiro único está listada.
- Seleccione o topo/cabeça da árvore e carregue com o botão direito para gravar como
- gravar o ficheiro para sobrepor a versão local modificada do ficheiro
- o ficheiro agora tem a versão correcta e já não será marcado para envio!