Por qué las palabras son importantes en los estudios de Big Data

Este artículo es un extracto de la guía del libro de Shortform "Todo el mundo miente" de Seth Stephens-Davidowitz. Shortform tiene los mejores resúmenes y análisis del mundo de los libros que deberías leer.

¿Le gusta este artículo? Suscríbase a una prueba gratuita aquí .

¿Por qué son importantes las palabras? ¿Cómo utilizan los datos las palabras?

Las palabras siempre se han utilizado como datos, pero el big data permite a los investigadores estudiar más palabras, especialmente en los motores de búsqueda. Sin palabras, no podríamos utilizar los motores de búsqueda para descubrir la verdad sobre las personas.

Aprenda por qué las palabras son importantes, según Seth Stephens-Davidowitz en su libro Todo el mundo miente.

Palabras, palabras, palabras

Utilizar las palabras como datos no es nada nuevo. Como señala Stephens-Davidowitz, lingüistas, científicos sociales, historiadores y otros profesionales llevan mucho tiempo estudiando las palabras y su uso. Pero los macrodatos aumentan espectacularmente el tipo y el volumen de palabras que los investigadores pueden estudiar.

Stephens-Davidowitz explica con más detalle por qué las palabras son importantes en relación con los resultados de los datos. Basa la mayoría de sus ideas y argumentos en los términos de búsqueda utilizados en Google y otros motores de búsqueda. Los motores de búsqueda -y las bases de datos de información que recopilan a medida que los usuarios los utilizan- son un invento relativamente reciente y representan una nueva fuente (o variedad) de datos para investigadores y analistas.

Stephens-Davidowitz señala que los ordenadores también facilitan el análisis de grandes volúmenes de texto o voz que serían difíciles o imposibles de tratar manualmente. Por ejemplo, cita un estudio sobre la frecuencia de las palabras en las actualizaciones de estado de Facebook y muestra cómo el uso de las palabras se desglosa en función del género y la edad: por ejemplo, como era de esperar, demuestra que los universitarios publican sobre "estudiar" durante el "semestre", mientras que los veinteañeros beben "cerveza" cuando no están "en_el_trabajo". Asimismo, explica que los investigadores pueden utilizar el análisis de sentimientos para determinar el tono emocional general de un texto. 

(Nota breve: Aunque Stephens-Davidowitz está entusiasmado con el uso que los investigadores académicos pueden hacer del análisis de textos -por ejemplo, cita estudios que utilizan el análisis de sentimientos para trazar trayectorias narrativas en obras de ficción-, la mayor parte de la aplicación práctica de estas técnicas parece tener lugar en el mundo empresarial. Por ejemplo, las empresas utilizan el análisis de textos y de sentimientos para medir el interés y las reacciones de los clientes, detectar problemas a tiempo y mejorar el servicio al cliente).

Breve historia de la búsqueda en Internet

¿Hasta qué punto son nuevos los datos de búsqueda? El primer motor de búsqueda, Archie, se lanzó en 1990 como una herramienta relativamente sencilla para buscar en servidores públicos de archivos (antes de Archie, Internet se indexaba a mano). A lo largo de la década de 1990, surgieron varios motores de búsqueda nuevos que permitían a los usuarios buscar en toda la web como estamos acostumbrados hoy en día. En 1998, Google introdujo mejores métodos de búsqueda y otras mejoras y se convirtió rápidamente en el motor de búsqueda predominante en todo el mundo: hoy en día, más del 90% de las búsquedas web se realizan a través de Google. 

No está claro si los primeros motores de búsqueda recopilaban los datos de búsqueda como lo hace Google, y al principio, ni siquiera Google publicaba sus datos de búsqueda con regularidad. En cualquier caso, es difícil imaginar la investigación de Stephens-Davidowitz antes de Google. Incluso si los motores de búsqueda anteriores hubieran recopilado datos de búsqueda, esos datos estarían repartidos entre un puñado de empresas en lugar de centralizados en un solo lugar. Asimismo, ninguno de esos motores de búsqueda anteriores tenía ni de lejos la base de usuarios que tiene Google hoy en día, y es la gran cantidad y actualidad(volumen y velocidad) de la información lo que hace que los datos de Google sean útiles para el tipo de estudios de Todo el mundo miente.

Por qué las palabras son importantes en los estudios de Big Data

---Fin de la vista previa.

¿Te gusta lo que acabas de leer? Lee el resto del resumen y el análisis del libro "Todo el mundo miente" de Seth Stephens-Davidowitz en Shortform .

Esto es lo que encontrará en nuestro resumen completo de Todos Mienten :

  • Cómo la gente confiesa sus secretos más oscuros a la búsqueda de Google
  • Cómo pueden utilizarse estos "grandes datos" en lugar de las encuestas voluntarias.
  • Los usos poco éticos y las limitaciones del big data

Muñeca Katie

De algún modo, Katie pudo hacer realidad su sueño infantil de crear una carrera en torno a los libros tras licenciarse en Inglés y especializarse en Escritura Creativa. Su género preferido de libros ha cambiado drásticamente a lo largo de los años, desde fantasía/distópica juvenil hasta novelas conmovedoras y libros de no ficción sobre la experiencia humana. Katie disfruta especialmente leyendo y escribiendo sobre todo lo relacionado con la televisión, bueno y malo.

Dejar una respuesta

Su dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *.