Find Jobs
Hire Freelancers

Data Mining - RegEx | Spanish Website | Python

$30-250 USD

Terminado
Publicado hace casi 5 años

$30-250 USD

Pagado a la entrega
ENGLISH ** Update: I just uploaded a small xlsx file with the desired output for you to have a better understanding of the problem. Note that I'd like every scraped field to be corrected. ** I have a Scrapy spider that collects data from a classifieds website like craiglist, where people post properties for sale or lease. I need help cleaning the gathered data because unfortunately the website doesn't force data types when posting the listings, which leads to a fair chunk of messy data. Not only that, but also people doesn't fully complete the forms when posting the listings, but rather include the information in the description box. There are 2 things that I need to get done: - Clean the data that has been filled on each field of the listing form - Extract from the description the remaining data and fill in the values to the corresponding field. I can upload my python script if you require it, if you fancy using regular expressions for problem 1. Extracted data will be uploaded so you get an idea of the work required. I believe that it would be preferably for you to speak spanish in order to understand the data posted in the description. ------------------------------------------------------------------------------------------------------------------------------------------------------ ESPAÑOL ** Actualización: Acabo de subir un archivo xlsx con los resultados que me gustaría obtener para que tengan una idea más clara del problema. Tengan en cuenta que prácticamente todas las variables que aparecen en el archivo necesitan corrección. ** Tengo un script en Scrapy que recolecta datos de avisos publicados en un sitio web similar a craiglist, donde la gente publica inmuebles a la venta o en alquiler. Necesito ayuda para limpiar los datos recolectados, ya que lamentablemente el sitio no fuerza el uso de ciertos tipos de datos al momento de cargar los avisos, lo que deja un montón de datos sucios. Además, la gente no completa todos los campos cuando carga su aviso, aunque suelen incluirla en la descripción. Hay dos tareas que necesito que haga el nuevo script: - Limpiar los datos que fueron cargados correctamente en el formulario de forma heterogénea - Extraer de la descripción la información faltante y completar los campos que no fueron completados. Si lo necesitas, puedo subir mi script de Python para que utilices expresiones regulares para resolver el primer problema. Los datos que dispongo actualmente serán cargados para que puedas analizar el problema. Creo que conviene que hables español para que puedas interpretar el texto incluido en la descripción de los avisos.
ID del proyecto: 19231870

Información sobre el proyecto

10 propuestas
Proyecto remoto
Activo hace 5 años

¿Buscas ganar dinero?

Beneficios de presentar ofertas en Freelancer

Fija tu plazo y presupuesto
Cobra por tu trabajo
Describe tu propuesta
Es gratis registrarse y presentar ofertas en los trabajos
Adjudicado a:
Avatar del usuario
Hello Franco,I am Python expert from Bosnia & Herzegovina,Europe. I have carefully gone through with your requirements and I would like to help you with this project ! I can start immediately and finish it within the agreed deadline. Check out my profile, portfolio and former clients feedback - that'll let you know everything about me. Please feel free to contact me so that we can discuss further details. Thank you for taking the time to read my proposal.I am looking forward to hearing from you. Best regards, Miljan
$222 USD en 3 días
4,9 (140 comentarios)
7,6
7,6
10 freelancers están ofertando un promedio de $167 USD por este trabajo
Avatar del usuario
I have seen the project - Data Mining - RegEx | Spanish Website | Python. I have been working in these fields((Data Mining, Python, Regular Expressions, Scrapy, Web Scraping)) for 7 yrs as a freelancer. I will never disappoint you and i will try my best to deliver good result always. Hope to work with you. Thank you.
$150 USD en 3 días
5,0 (62 comentarios)
6,5
6,5
Avatar del usuario
Hola Ché, ¿qué tal?... Tal vez yo pueda ayudarte, soy programador certificado en Python, hablemos de tu proyecto por chat. Gracias :)
$150 USD en 2 días
5,0 (97 comentarios)
6,6
6,6
Avatar del usuario
Qué tal! Soy de Argentina, tengo experiencia haciendo scrapings y si a veces la info en algunos sitios sale media rara asi que entiendo tu problema. Se podría encarar de diversas formas, si te interesa escribime y contame bien el problema, mostrame los sitios con los ejemplos problemáticos y vemos si podemos hacer algun arreglo al script o repasar las entradas que veas raras en tu dataset. Saludos!
$111 USD en 7 días
5,0 (33 comentarios)
5,8
5,8
Avatar del usuario
“Python-Regular Exp” I have worked on similar projects to what you are looking for, and I am confident I can exceed your expectations. I can start your work right away. Please message me. Thanks
$150 USD en 1 día
4,7 (66 comentarios)
5,4
5,4
Avatar del usuario
Hi to Argentina, EXPERT HERE :) okay I have 6 + years experience in this field. Please visit My profile and see the previous project's reviews, I am interested and ready to start, lets discuss with details. looking forward to hear from you soon. Thanks & Regards
$200 USD en 1 día
0,0 (0 comentarios)
0,0
0,0
Avatar del usuario
Hola soy estudiante de ING civil en busca de empleo y nuevos conocimientos tengo buenas habilidades en excel
$111 USD en 10 días
0,0 (0 comentarios)
0,0
0,0
Avatar del usuario
Tengo una gran soltura con el teclado y amplia experiencia con excel; mi capacidad para procesar grandes volumenes de datos y tablas, asi como una velocidad con el teclado superior a las 400 pulsaciones por minuto, hacen que este tipo de trabajos sean ideales para mi; calculo que puedo entregar una hoja con 2000 entradas corregida en 3 o 4 horas, pero no sabré un tiempo exacto hasta que resuelva alguna por completo.
$222 USD en 4 días
0,0 (0 comentarios)
0,0
0,0

Sobre este cliente

Bandera de ARGENTINA
San Juan, Argentina
5,0
2
Forma de pago verificada
Miembro desde mar 27, 2018

Verificación del cliente

Otros trabajos de este cliente

Python web crawler
$450-4000 USD
¡Gracias! Te hemos enviado un enlace para reclamar tu crédito gratuito.
Algo salió mal al enviar tu correo electrónico. Por favor, intenta de nuevo.
Usuarios registrados Total de empleos publicados
Freelancer ® is a registered Trademark of Freelancer Technology Pty Limited (ACN 142 189 759)
Copyright © 2024 Freelancer Technology Pty Limited (ACN 142 189 759)
Cargando visualización previa
Permiso concedido para Geolocalización.
Tu sesión de acceso ha expirado y has sido desconectado. Por favor, inica sesión nuevamente.