hola a los amigos de humanos, dejenme darles un intro de mi problema:
en mi centro de trabajo poseo montada una pc que utiliza desde antaño el google desktop y el DNKA 0.30, el objetivo de esto como ustedes deben conocer es tener un buscador web como google para realizar consultas a los documentos almacenados en la PC, resulto ser una interfas util hasta que se comensaron a guardar en la pc documentos de word con la extensión *.docx, la situación radica en que los documentos se indexan de manera correcta pero cuando se consulta el buscador no muestra el contenido interno de dichos archivos, conosco por un amigo que estudio en la UCI que ustedes han realizado trabajos con nutch, solr y orion para la busqueda de videos e imágenes en la web, quisiera conocer como configurar nutch y solr para el rastreo e indexación de documentos word y pdf en la propia pc, así como un buscador web que muestre el contenido dentro de estos documentos. AYUDENME A MIGRAR A LINUX.