Cada vez se habla mas del Big data, es la nueva moda... Empresas como Cloudera están de moda!
¿En realidad, que es el big data? ¿Alguien lo comprende?
La realidad es que Big Data son un conjunto de Bases de datos no relacionales (Las de toda la vida) que procesan la información de forma muy eficiente y rápida.
Se empieza a hablar de Big Data cuando no se puede procesar la información de forma convencional, cuando no te cabe en el excel o mas allá cuando en una base de datos típica el procesar tantos datos lleva tantísimo tiempo que no es factible.
Yo mismo en mi día a día en el trabajo me encuentro con esos problemas, millones y cientos de millones de datos, y los ejecutivos quieren ver reportes y resultados y las máquinas mas caras funcionan día y noche procesando datos, aun así no llegan a tiempo.
Diríamos... La solución es el Big Data! Procesar mucho mas de forma mas eficiente! Escalable... Actualmente las bases de datos no escalan bien, es decir no es lo mismo una máquina muy potente que muchas pequeñas juntas, esto ultimo si funciona con Big Data y es lo que usa Amazon, Google, Facebook, Twitter... etc...
Pero todo no es tan sencillo, cada una de estas bases de datos es muy diferente a las convencionales, cada una tiene su forma de hacer las cosas, pero todas tienen algo en común, es muchísimo mas difícil extraer la información, con las bases de datos convencionales el programador obtiene la información de forma muy sencilla dice "Dame todos los usuarios que cumplen este requisito entre tal y cual fecha" y la base de datos le da la información, con Big Data, es otro mundo, la información se almacena de forma que favorezca determinadas extracciones, hay que hacer complicados procesos map-reduce, todo se complica.
¿Que implica esto? Que hay un nuevo campo de expertos en manipulación de datos, ahora se les llama "Data Scientists" y a día de hoy se les paga muy bien: Big Data
En Inbestia también nos modernizamos y el año que viene sacaremos una nueva versión del website que utilizara Big Data para analizar estadísticas, visitas, clicks etc... Y esperemos que no tardemos mucho en aplicar Big Data a datos de mercado!
¡A ver si también mejora el buscador! Porque ya ni lo intento. Uso google con el modificador site: inbestia.com
gracias por avisar, tomamos nota!
Ramón, en 8 semanas eso ya no será un problema.
Excelente iniciativa la de usar Big Data.
El problema que estoy leyendo sobre BigData, es la avidez de algunas empresas por coleccionar datos y más datos y comienza a ponerse en compromiso el mantenimiento de la privacidad para dar preferencia a los beneficios.
¡¡¡¡ Espero que el uso de BigData no os conevierta en devoradores de datos, al precio que sea !!!
Saludos
La privacidad y la informacion son cosas diferentes... los datos de cada click, de cada visita, etc... pueden ser muchisimo, ocupar mucho espacio y hacer la web lenta, por eso hay que buscar alternativas!
otra sugerencia: poder clasificar el contenido guardado por etiquetas sería muy útil, porque en cuanto se vuelve "big data" no hay forma de encontrar nada
¿A qué te refieres con contenido guardado?
El de guardar como favorito, una forma de organizarlo, no?
sí, eso es
cuando guardo un artículo como favorito es porque me parece que vale la pena tenerlo a mano para releer o consultar
pero con el tiempo acumulas cientos de artículos y ya no hay forma de encontrar nada
eso me ha pasado en montones de webs, ahora estoy guardando los contenidos interesantes en delicious para tenerlos etiquetados, pero sería mejor si pudiese clasificar los correspondientes a inbestia aquí mismo
¿Qué manera de organizarlos recomiendas? ¿carpetas o etiquetas?
Cual es tu delicious? ;-)
yo creo que lo mejor son etiquetas porque muchas veces, el mismo artículo interesa guardarlo en varias categorías distintas
en delicious soy wenomeno, como en tu foro, yo uso el mismo nick en todos lados, casi todos los links son de economía y finanzas
ahhh vale! Ahora ya te identifico! Voy a ver tu delicious!
A ver si lo he entendido:
¿Tiene esto del manejo de "Big Data" alguna similitud aunque solo sea de concepto, con la computación distribuída tipo "proyecto Seti" y similares patrocinados por IBM a través del World Comunity Grid?
(Por cierto que han sacado la versión para Android para que sude tambien el teléfono, tableta, etc, no solo el ordenador. Y tienen un montón de proyectos científico-médicos más que loables necesarios)
Bid Data es algo muy generico! Simplemente es procesar los datos de firma no convencional, grafos = Neo4j, tipo Facebook = Cassandra, Amazon = Dynamo, Google = Hadoop.... una larga lista... cada uno con sus pros y sus contras...
Anoto delicius para investigarlo
No dejáis descansar a uno ;-)