Indexar o wikipedia com solr

instalei o solr 4.6.0 e sigo o tutorial disponível na página inicial do Solr. Estava tudo bem, até ter de fazer um trab ... l é confuso quando lida com indexação da Wikipédia. Qualquer conselho para dar algumas indicações ao folow seria bom.

Hadoop para o conjunto de dados de números de páginas do Wikipedia

eu quero construir um Hadoop-Job que basicamente toma o wikipedia pagecount-statistic como entrada e cria uma lista co ... Cluster, por isso alterar a tarefa ainda está bem Editar: Aqui está uma discussão semelhante que acabei de encontrar..

A carregar o 'Dump' do Wikipédia na pesquisa elastica

quero carregar um 'dump' do Wikipédia em XML como: http://ftp.acc.umu.se/mirror/wikimedia.org/dumps/enwiki/20171001/enwi ... com a minha versão Elasticsearch. Alguém pode explicar qual é a melhor maneira de importar o lixo para a busca elastica?

Procurar no Wikipédia com a API

quero procurar na Wikipédia usando a acção query. Estou a usar este url: Http://en.wikipedia.org/w/ap ... fazer isso? Nota: essa url funciona bem quando há apenas um resultado.. Só preciso do título e de uma breve descrição.

Existe uma API da Wikipédia?

na minha página de Utilizador da Wikipédia, corro um programa da Wikipédia que mostra as minhas estatísticas (número de ... vidade mensal, etc.). Gostaria de colocar esta informação no meu blog. Há alguma API que me permita fazer algo assim?