Lukket

Web scraping de webs con ficheros de salida en formato XML.

Estamos buscando un Desarrollador o Empresa con experiencia en la extracción de datos de&nbsp; dominio público en webs, mediante técnicas de web scraping.<ul><li>Las webs con las que se trabajará son webs inmobiliarias, con decenas de miles de registros.</li><li>Los resultados se entregarán en un formato XML ya prefectamente definido y que se entregará a los interesados para realizar el presupuesto.</li><li>Algunos campos requerirán conversiones de identificadores, según tablas de conversión que habrá que confeccionar.</li><li>Se prevee realizar el trabajo sobre un mínimo de 3 webs y un máximo de 10. Se indicará a los interesados exáctamente qué webs son sobre las que se realizará el proyecto.</li><li>Se aceptará un precio diferente por web, según su dificultad.</li><li>Los scripts estarán preparados para ejecutarse periódicamente, con la posibilidad de generar todos los registros o tan solo aquellos registros que contengan diferencias desde la generación previa.</li><li>Existirá la posibilidad de un mantenimiento a largo plazo.</li><li>Se considerarán las propuestas que ofrezcan una modalidad de servicio "tipo outsourcing", es decir, que generen los ficheros de salida XML en sus propios sistemas y se envíen periódicamente al cliente.</li><li>El proveedor deberá hacer entrega del código fuente desarrollado y utilizado para generar los ficheros.</li></ul><strong>Se valorará especialmente:</strong><ul><li>La sencillez, rendimiento y&nbsp; efectividad de la solución propuesta.</li><li>El uso de herramientas open-source exclusivamente.</li><li>Experiencia previa en proyectos similares.</li></ul>

<strong>Habilidades/requisitos deseados:</strong>

- <strong>Lenguajes de Programación</strong>: cualquiera cuyos scripts puedan ejecutarse bajo Linux. Preferiblemente PHP, Python o alguna herramienta/plataforma específica para web scraping.

- <strong>Habilidades adicionales:</strong> XPath, XML, JSON, Regex, Linux scripts.

Evner: JSON, PHP, Python, XML

Om arbejdsgiveren:
( 0 bedømmelser ) Russian Federation

Projekt ID: #12370767

3 freelancere byder i gennemsnit €250 på dette job

madridnyc

Hola, Mi nombre es Anabel Osuna, Project manager de MadridNYC, hacemos diseño web, gráfico, desarrollo de aplicaciones a medida, posicionamiento en buscadores, gestión de contenidos, creación de vídeos y RRHH y Outs Flere

€250 EUR in 14 dage
(3 bedømmelser)
4.3
fedearr

Hola, Tengo gran experiencia en desarrollo de scripts para extracción de datos, en PHP/MySQL. Necesitaría me diera detalles de las webs a explorar y el formato XML de salida para una cotización adecuada. Pue Flere

€250 EUR in 14 dage
(0 bedømmelser)
0.0
martinpanelati

Ya tenemos experiencia en scraping de otras webs, locales e internacionales. Trabajaríamos en Python, todo con software libre. Cumplimos todos los requisitos del proyecto. Si lo desean podemos hacerlo con la modalid Flere

€250 EUR in 14 dage
(0 bedømmelser)
0.0