Como obter esparsamente apenas um único arquivo de um repositório git?

Como faço para obter apenas um arquivo de um git repo?

Author: dreftymac, 2010-03-17

21 answers

Originalmente, eu mencionei em 2012 git archive (consulte Jared Forsyth's resposta e Robert Knight's resposta), pois git1.7.9.5 (Março de 2012), Paul Brannan's resposta:

git archive --format=tar --remote=origin HEAD:path/to/directory -- filename | tar -O -xf -

Mas: em 2013, isso já não era possível para remotos https://github.com URLs .
Veja a página antiga " posso arquivar um repositório?"

A actual Página (2018) " sobre arquivar conteúdos e dados sobre o GitHub " recomenda a utilização de serviços de terceiros como GHTorrent ou GH Archive .


Para que também possa lidar com cópias/Clones locais:

Pode, em alternativa, fazer o seguinte se tiver uma cópia local do repositório bare, tal como mencionado em esta resposta,

git --no-pager --git-dir /path/to/bar/repo.git show branch:path/to/file >file

Ou tens de clonar primeiro o repo, o que significa que tens a história completa.: - no .git repo - no trabalho arvore.
  • mas depois podes fazer um saída esparsa (Se estiver a utilizar Git1. 7+),:
    • activar a opção de saída esparsa(git config core.sparsecheckout true)
    • adicionando o que quer ver no ficheiro .git/info/sparse-checkout
    • reler a árvore de trabalho para mostrar apenas o que precisa

Para reler a árvore de trabalho:

$ git read-tree -m -u HEAD
Dessa forma, você acaba com uma árvore de trabalho, incluindo precisamente o que você quer (mesmo que seja apenas um file)

Richard Gomes pontos ( nos comentários {[[11]}) para " como é que eu clono, obtenho ou escasso um único directório ou uma lista de directórios do repositório git?"

Uma função bash que evita descarregar o histórico, que recupera um único ramo e que recupera uma lista de ficheiros ou directórios de que necessita.

 258
Author: VonC, 2020-02-12 14:55:33

Primeiro clone o repo com a opção-n, que suprime a saída por omissão de todos os ficheiros, e a opção --depth 1, o que significa que só obtém a revisão mais recente de cada ficheiro

git clone -n git://path/to/the_repo.git --depth 1

Então confira apenas o arquivo que você quer assim:

cd the_repo
git checkout HEAD name_of_file
 211
Author: Nick Moore, 2011-06-16 10:44:35

Se já tiver uma cópia do Acordo de recompra do git, poderá sempre obter uma versão de um ficheiro que utilize um git log para descobrir o ID do hash (por exemplo, 3cdc61015724f9965575ba954c8cd4232c8b42e4) e então poderá simplesmente escrever:

git checkout hash-id path-to-file

Aqui está um exemplo real:

git checkout 3cdc61015724f9965575ba954c8cd4232c8b42e4 /var/www/css/page.css
 108
Author: techexpert, 2012-06-27 19:14:13

Normalmente não é possível baixar apenas um arquivo de git sem baixar todo o repositório, como sugerido na primeira resposta. É porque o Git não armazena arquivos como você pensa (como CVS/SVN faz), mas gera-os com base em toda a história do projeto.

([13]) mas existem alguns métodos de trabalho para casos específicos. Exemplos abaixo com substituições para user, project, branch, filename.

GitHub

wget https://raw.githubusercontent.com/user/project/branch/filename

GitLab

wget https://gitlab.com/user/project/raw/branch/filename

GitWeb

Se estiver a usar Git no servidor-GitWeb , então poderá tentar no exemplo (alterá-lo para o caminho certo):

wget "http://example.com/gitweb/?p=example;a=blob_plain;f=README.txt;hb=HEAD"

GitWeb at drupalcode.org

Exemplo:

wget "http://drupalcode.org/project/ads.git/blob_plain/refs/heads/master:/README.md"

Googlesource.com

Existe uma funcionalidade não documentada que lhe permite baixar as versões codificadas do raw em base64 ficheiros:

curl "https://chromium.googlesource.com/chromium/src/net/+/master/http/transport_security_state_static.json?format=TEXT" | base64 --decode

Noutros casos, verifique se o seu repositório Git está a usar quaisquer interfaces web.

Se não estiver a usar qualquer interface web, pode considerar enviar o seu código para serviços externos como GitHub, Bitbucket, etc . e usá-lo como um espelho.

Se não tiver wget instalado, tente curl -O (url) Em alternativa.

 66
Author: kenorb, 2019-12-15 18:14:17
 46
Author: Geoffrey Hale, 2017-05-23 11:55:07

Git checkout branch_ or_version -- path / file

Exemplo: git checkout HEAD -- main.c
 44
Author: Thomas Brushington, 2012-05-30 06:23:07

Agora podemos!Como este é o primeiro resultado no google, pensei em Actualizar isto para a última posição. Com o advento do git 1.7.9.5, temos o comando git archive que lhe permitirá recuperar um único arquivo de um host remoto.

git archive --remote=git://git.foo.com/project.git HEAD:path/in/repo filename | tar -x

Veja a resposta completa aqui https://stackoverflow.com/a/5324532/290784

 30
Author: Jared Forsyth, 2019-01-16 09:04:30

Trabalhar no GIT 1.7.2.2

Por exemplo, você tem um controle remoto some_remote, com ramos branch1, branch32

Para obter um ficheiro específico, você chama a isto comandos:

git checkout remote/branch path/to/file

Como exemplo, será algo como isto

git checkout some_remote/branch32 conf/en/myscript.conf
git checkout some_remote/branch1 conf/fr/load.wav

Este comando de saída irá copiar toda a estrutura de ficheiros conf / en e conf / fr para a pasta actual, onde você chama estes comandos (claro que assumo que você executou o git init em algum momento antes)

 24
Author: anvk, 2011-07-06 17:54:49

Muito simples:

git checkout from-branch-name -- path/to/the/file/you/want

Isto não vai verificar o ramo from-branch-name. Você vai ficar em qualquer branch que você está, e apenas esse único arquivo será verificado a partir do branch especificado.

Aqui está a parte relevante da manpage para git-checkout
git checkout [-p|--patch] [<tree-ish>] [--] <pathspec>...
       When <paths> or --patch are given, git checkout does not switch
       branches. It updates the named paths in the working tree from the
       index file or from a named <tree-ish> (most often a commit). In
       this case, the -b and --track options are meaningless and giving
       either of them results in an error. The <tree-ish> argument can be
       used to specify a specific tree-ish (i.e. commit, tag or tree) to
       update the index for the given paths before updating the working
       tree.

Gorjetas para Ariejan de Vroom que me ensinou isso a partir deste postblog post .

 15
Author: broc.seib, 2015-04-21 03:14:13

git clone --filter do Git 2.19

Esta opção irá de facto saltar a obtenção da maioria dos objectos sem necessidade do servidor:

git clone --depth 1 --no-checkout --filter=blob:none \
  "file://$(pwd)/server_repo" local_repo
cd local_repo
git checkout master -- mydir/myfile

O servidor deve ser configurado com:

git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1

Não existe suporte de servidor a partir de v2. 19. 0, mas já pode ser testado localmente.

TODO: --filter=blob:none Salta todas as bolhas, mas ainda Apanha todos os objectos das árvores. Mas em um repo normal, este deve ser minúsculo em comparação com os arquivos em si, então isso já é bom o suficiente. Perguntado em: https://www.spinics.net/lists/git/msg342006.html Devs respondeu que um --filter=tree:0 está em obras para fazer isso.

Lembre-se que --depth 1 já implica --single-branch, Veja também: Como é que clono um único ramo no Git?

file://$(path) é necessário ultrapassar git clone as brincadeiras do protocolo: Como clonar um repositório de git local com um caminho relativo?

O formato de --filter está documentado em man git-rev-list.

Foi feita uma extensão ao protocolo Git remote para apoiar este recurso.

Docs on Git tree:

Teste-o

#!/usr/bin/env bash
set -eu

list-objects() (
  git rev-list --all --objects
  echo "master commit SHA: $(git log -1 --format="%H")"
  echo "mybranch commit SHA: $(git log -1 --format="%H")"
  git ls-tree master
  git ls-tree mybranch | grep mybranch
  git ls-tree master~ | grep root
)

# Reproducibility.
export GIT_COMMITTER_NAME='a'
export GIT_COMMITTER_EMAIL='a'
export GIT_AUTHOR_NAME='a'
export GIT_AUTHOR_EMAIL='a'
export GIT_COMMITTER_DATE='2000-01-01T00:00:00+0000'
export GIT_AUTHOR_DATE='2000-01-01T00:00:00+0000'

rm -rf server_repo local_repo
mkdir server_repo
cd server_repo

# Create repo.
git init --quiet
git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1

# First commit.
# Directories present in all branches.
mkdir d1 d2
printf 'd1/a' > ./d1/a
printf 'd1/b' > ./d1/b
printf 'd2/a' > ./d2/a
printf 'd2/b' > ./d2/b
# Present only in root.
mkdir 'root'
printf 'root' > ./root/root
git add .
git commit -m 'root' --quiet

# Second commit only on master.
git rm --quiet -r ./root
mkdir 'master'
printf 'master' > ./master/master
git add .
git commit -m 'master commit' --quiet

# Second commit only on mybranch.
git checkout -b mybranch --quiet master~
git rm --quiet -r ./root
mkdir 'mybranch'
printf 'mybranch' > ./mybranch/mybranch
git add .
git commit -m 'mybranch commit' --quiet

echo "# List and identify all objects"
list-objects
echo

# Restore master.
git checkout --quiet master
cd ..

# Clone. Don't checkout for now, only .git/ dir.
git clone --depth 1 --quiet --no-checkout --filter=blob:none "file://$(pwd)/server_repo" local_repo
cd local_repo

# List missing objects from master.
echo "# Missing objects after --no-checkout"
git rev-list --all --quiet --objects --missing=print
echo

echo "# Git checkout fails without internet"
mv ../server_repo ../server_repo.off
! git checkout master
echo

echo "# Git checkout fetches the missing file from internet"
mv ../server_repo.off ../server_repo
git checkout master -- d1/a
echo

echo "# Missing objects after checking out d1/a"
git rev-list --all --quiet --objects --missing=print

GitHub upstream .

Saída no Git v2.19.0:

# List and identify all objects
c6fcdfaf2b1462f809aecdad83a186eeec00f9c1
fc5e97944480982cfc180a6d6634699921ee63ec
7251a83be9a03161acde7b71a8fda9be19f47128
62d67bce3c672fe2b9065f372726a11e57bade7e
b64bf435a3e54c5208a1b70b7bcb0fc627463a75 d1
308150e8fddde043f3dbbb8573abb6af1df96e63 d1/a
f70a17f51b7b30fec48a32e4f19ac15e261fd1a4 d1/b
84de03c312dc741d0f2a66df7b2f168d823e122a d2
0975df9b39e23c15f63db194df7f45c76528bccb d2/a
41484c13520fcbb6e7243a26fdb1fc9405c08520 d2/b
7d5230379e4652f1b1da7ed1e78e0b8253e03ba3 master
8b25206ff90e9432f6f1a8600f87a7bd695a24af master/master
ef29f15c9a7c5417944cc09711b6a9ee51b01d89
19f7a4ca4a038aff89d803f017f76d2b66063043 mybranch
1b671b190e293aa091239b8b5e8c149411d00523 mybranch/mybranch
c3760bb1a0ece87cdbaf9a563c77a45e30a4e30e
a0234da53ec608b54813b4271fbf00ba5318b99f root
93ca1422a8da0a9effc465eccbcb17e23015542d root/root
master commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
mybranch commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
040000 tree b64bf435a3e54c5208a1b70b7bcb0fc627463a75    d1
040000 tree 84de03c312dc741d0f2a66df7b2f168d823e122a    d2
040000 tree 7d5230379e4652f1b1da7ed1e78e0b8253e03ba3    master
040000 tree 19f7a4ca4a038aff89d803f017f76d2b66063043    mybranch
040000 tree a0234da53ec608b54813b4271fbf00ba5318b99f    root

# Missing objects after --no-checkout
?f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb
?308150e8fddde043f3dbbb8573abb6af1df96e63

# Git checkout fails without internet
fatal: '/home/ciro/bak/git/test-git-web-interface/other-test-repos/partial-clone.tmp/server_repo' does not appear to be a git repository
fatal: Could not read from remote repository.

Please make sure you have the correct access rights
and the repository exists.

# Git checkout fetches the missing directory from internet
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.

# Missing objects after checking out d1
?f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb

Conclusões: faltam todas as bolhas, excepto d1/a. Por exemplo, f70a17f51b7b30fec48a32e4f19ac15e261fd1a4, que é d1/b, não está lá depois de sair d1/.

Note que root/root e mybranch/mybranch também estão em falta, mas --depth 1 esconde isso da lista de ficheiros em falta. Se você remover --depth 1, então eles aparecem na lista de arquivos em falta.

 10
Author: Ciro Santilli TRUMP BAN IS BAD, 2018-11-21 20:44:24

Duas variantes do que já foi dado:

git archive --format=tar --remote=git://git.foo.com/project.git HEAD:path/to/directory filename | tar -O -xf -

E:

git archive --format=zip --remote=git://git.foo.com/project.git HEAD:path/to/directory filename | funzip

Estes escrevem o ficheiro para o resultado padrão.

 8
Author: Paul Brannan, 2013-10-21 18:08:08

Podes fazê-lo até

git archive --format=tar --remote=origin HEAD | tar xf -
git archive --format=tar --remote=origin HEAD <file> | tar xf -
 8
Author: Fizer Khan, 2014-02-13 13:24:01
Diz que o nome do ficheiro é 123.txt, isto funciona para mim:
git checkout --theirs  123.txt

Se o ficheiro estiver dentro de uma pasta A, certifique-se de O especificar correctamente:

git checkout --theirs  "A/123.txt"
 7
Author: Joseph Wu, 2018-02-19 08:09:43

Aqui está a solução completa para puxar e empurrar apenas um ficheiro em particular dentro do repositório git:

  1. primeiro precisa de clonar o repositório git com uma dica especial - sem saída
git clone --no-checkout <git url>
  1. o próximo passo é livrar-se dos ficheiros não localizados no índice com o comando:
git reset
  1. agora é-lhe permitido começar a extrair os ficheiros que deseja alterar com o comando:
git checkout origin/master <path to file>
  1. Agora a pasta do repositório contém os ficheiros que você poderá comece a editar imediatamente. Após a edição, você precisa executar uma sequência simples e familiar de comandos.
git add <path to file>
git commit -m <message text>
git push
 7
Author: ripreal, 2020-07-23 15:44:42

No git você não faz' checkout ' arquivos antes de atualizá - los - parece que isso é o que você está procurando.

Muitos sistemas como o clearcase, csv e assim por diante requerem que você 'checkout' um arquivo antes que você possa fazer alterações a ele. O Git não precisa disto. Você clonar um repositório e, em seguida, fazer alterações em sua cópia local do repositório.

Assim que actualizar os ficheiros, poderá fazer:

git status

Para ver que ficheiros foram modificados. Você adiciona os que deseja comprometer para index primeiro com (index é como uma lista a ser verificada):

git add .

Ou

git add blah.c

Depois do git status mostrar-lhe-á quais os ficheiros que foram modificados e quais os que estão em index prontos para serem iniciados ou verificados.

Para enviar os ficheiros para a sua cópia do repositório, Faça:

git commit -a -m "commit message here"

Ver git sítio web para ligações a manuais e guias.

 4
Author: stefanB, 2010-03-18 00:08:30
Parece que estás a tentar levar uma ideia do controlo centralizado de versões, que por natureza não é, está distribuída. Se você quiser trabalhar com um repositório git, você o clone. Você então tem Todo do conteúdo da árvore de trabalho, e Todo da história (bem, pelo menos tudo que leva até a ponta do ramo atual), não apenas um único arquivo ou um instantâneo de um único commit.
 git clone /path/to/repo
 git clone git://url/of/repo
 git clone http://url/of/repo
 1
Author: Cascabel, 2010-03-18 00:03:31

Se precisar de um ficheiro específico de um ramo específico de um repositório remoto de Git, o comando é:

git archive --remote=git://git.example.com/project.git refs/heads/mybranch path/to/myfile |tar xf -

O resto pode ser derivado da resposta de @VonC:

Se precisar de um ficheiro específico do ramo principal é:

git archive --remote=git://git.example.com/project.git HEAD path/to/myfile |tar xf -

Se precisar de um ficheiro específico de uma marca, é:

git archive --remote=git://git.example.com/project.git mytag path/to/myfile |tar xf -
 1
Author: Alex Harvey, 2017-07-08 11:04:56
Não vejo o que funcionou comigo aqui, por isso vou incluí-lo se alguém estiver na minha situação.

A minha situação, eu tenho um repositório remoto de talvez 10.000 arquivos e eu preciso construir um arquivo RPM para o meu sistema Linux. A construção do RPM inclui um clone git de tudo. Só preciso de um ficheiro para começar a construção do RPM. Eu posso clonar toda a árvore fonte que faz o que eu preciso, mas leva mais dois minutos para baixar todos esses arquivos quando tudo o que eu preciso é um. I tentei usar a opção de arquivo GIT discutida e fiquei "fatal: operação não suportada pelo protocolo."Parece que eu tenho que obter algum tipo de opção de arquivo ativado no servidor e meu servidor é mantido por bandidos burocráticos que parecem gostar de tornar difícil fazer as coisas feitas.

O que eu finalmente fiz foi entrar na interface web da bitbucket e ver o único arquivo que eu precisava. Eu fiz um clique direito sobre o link para baixar uma cópia raw do arquivo e selecionado "Copiar atalho" de o popup resultante. Eu não poderia simplesmente baixar o arquivo raw porque eu precisava automatizar as coisas e eu não tenho uma interface de navegador no meu servidor Linux.

Para o bem da discussão, isso resultou na URL:

https://ourArchive.ourCompany.com/projects/ThisProject/repos/data/raw/foo/bar.spec?at=refs%2Fheads%2FTheBranchOfInterest

Não consegui descarregar directamente este ficheiro do repositório de bitbucket porque precisava de assinar primeiro. Depois de um pouco de pesquisa, encontrei isto a funcionar.: No Linux:

echo "myUser:myPass123"| base64
bXlVc2VyOm15UGFzczEyMwo=

curl -H 'Authorization: Basic bXlVc2VyOm15UGFzczEyMwo=' 'https://ourArchive.ourCompany.com/projects/ThisProject/repos/data/raw/foo/bar.spec?at=refs%2Fheads%2FTheBranchOfInterest' > bar.spec
Esta combinação permitiu-me descarregar o único ficheiro de que precisava para construir tudo. mais.
 0
Author: user1683793, 2018-09-18 00:04:03

Estou a adicionar esta resposta como uma alternativa a fazer um check-out formal ou uma operação local semelhante. Assumindo que você tem acesso à interface web do seu provedor de Git, você pode ser capaz de visualizar diretamente qualquer arquivo em um determinado commit desejado. Por exemplo, no GitHub você pode usar algo como:

https://github.com/hubotio/hubot/blob/ed25584f/src/adapter.coffee

Aqui ed25584f estão os primeiros 8 caracteres do hash SHA - 1 do commit of interest, seguido pelo caminho para o ficheiro de código.

Similarmente, em Bitbucket nós podemos tente:

https://bitbucket.org/cofarrell/stash-browse-code-plugin/src/06befe08

Neste caso, colocamos o hash de commit no final do URL de origem.

 0
Author: Tim Biegeleisen, 2019-02-10 02:38:30

Se você só precisa baixar o arquivo, não precisa verificar com o Git.

Github Mate é muito mais fácil de fazer isso, é uma extensão Chrome, permite que você clique no ícone de arquivo para baixá-lo. também Código Aberto

 -3
Author: Cam Song, 2013-12-18 05:29:47

Se editou uma versão local de um ficheiro e deseja voltar à versão original mantida no servidor central, isto pode ser facilmente conseguido usando As Extensões git.

  • inicialmente o ficheiro será marcado para envio, uma vez que foi modificado
  • seleccione (duplo-click) o ficheiro no menu árvore de ficheiros
  • a árvore de revisão para o ficheiro único está listada.
  • Seleccione o topo/cabeça da árvore e carregue com o botão direito para gravar como
  • gravar o ficheiro para sobrepor a versão local modificada do ficheiro
  • o ficheiro agora tem a versão correcta e já não será marcado para envio!
Calma!
 -3
Author: Robert Taylor, 2015-08-11 10:39:51