Los datos no estructurados, generalmente son datos binarios que no tienen estructura interna identificable. Es un conglomerado masivo y desorganizado de varios objetos que no tienen valor hasta que se identifican y almacenan de manera organizada.
La naturaleza compleja del Big Data se debe principalmente a la naturaleza no estructurada de gran parte de los datos generados por las tecnologías modernas, como los web logs, la identificación por radiofrecuencia (RFID), los sensores incorporados en dispositivos, la maquinaria, los vehículos, las búsquedas en Internet, las redes sociales como Facebook, computadoras portátiles, teléfonos inteligentes y otros teléfonos móviles, dispositivos GPS y registros de centros de llamadas.
Los datos no estructurados típicos generados por el hombre incluyen:
- Archivos de texto: procesamiento de textos, hojas de cálculo, presentaciones, correo electrónico, registros.
- Correo electrónico: el correo electrónico tiene cierta estructura interna gracias a sus metadatos, y a veces lo llamamos semiestructurado. Sin embargo, su campo de mensaje no está estructurado y las herramientas de análisis tradicionales no pueden analizarlo.
- Redes sociales: Datos de Facebook, Twitter, LinkedIn.
- Sitios web: YouTube, Instagram, sitios para compartir fotos.
- Datos móviles: mensajes de texto, ubicaciones.
- Comunicaciones: chat, mensajería instantánea, grabaciones telefónicas, software de colaboración.
- Medios: MP3, fotos digitales, archivos de audio y video.
- Aplicaciones empresariales: documentos de MS Office, aplicaciones de productividad.
Los datos no estructurados típicos generados por una máquina incluyen:
- Imágenes satelitales: datos meteorológicos, formas terrestres, movimientos militares.
- Datos científicos: exploración de terreno, exploración espacial, imágenes sísmicas, datos atmosféricos.
- Vigilancia digital: Fotos de vigilancia y video.
- Datos de sensores: tráfico, clima, sensores oceanográficos.