miércoles, 21 de marzo de 2018

¿Cuál base de datos es mejor OLAP VS OLTP?


Definición de OLTP - On-Line Transactional Processing
Los sistemas OLTP son bases de datos orientadas al procesamiento de transacciones. Una transacción genera un proceso atómico (que debe ser validado con un commit, o invalidado con un rollback), y que puede involucrar operaciones de inserción, modificación y borrado de datos. El proceso transaccional es típico de las bases de datos operacionales.

Definición  de OLAP - On-Line Analytical Processing

Los sistemas OLAP son bases de datos orientadas al procesamiento analítico. Este análisis suele implicar, generalmente, la lectura de grandes cantidades de datos para llegar a extraer algún tipo de información útil: tendencias de ventas, patrones de comportamiento de los consumidores, elaboración de informes complejos… etc. Este sistema es típico de los datamarts.

Cuadro comparativo de OLAP VS OLTP

OLTP - On-Line Transactional Processing
OLAP - On-Line Analytical Processing
El acceso a los datos está optimizado para tareas frecuentes de lectura y escritura. (Por ejemplo, la enorme cantidad de transacciones que tienen que soportar las BD de bancos o hipermercados diariamente).
El acceso a los datos suele ser de sólo lectura. La acción más común es la consulta, con muy pocas inserciones, actualizaciones o eliminaciones.
Los datos se estructuran según el nivel aplicación (programa de gestión a medida, ERP o CRM implantado, sistema de información departamental...).
Los datos se estructuran según las áreas de negocio, y los formatos de los datos están integrados de manera uniforme en toda la organización.
Los formatos de los datos no son necesariamente uniformes en los diferentes departamentos (es común la falta de compatibilidad y la existencia de islas de datos).

El historial de datos es a largo plazo, normalmente de dos a cinco años.

El historial de datos suele limitarse a los datos actuales o recientes.

Las bases de datos OLAP se suelen alimentar de información procedente de los sistemas operacionales existentes, mediante un proceso de extracción, transformación y carga (ETL).






















Conclusión del vs entre OLTP Y OLAP

Las aplicaciones OLTP se caracterizan por la creación de muchos usuarios, actualizaciones o recuperación de registros individuales. Por consiguiente, las bases de datos OLTP se perfeccionan para actualización de transacciones. Las aplicaciones OLAP son usadas por analistas y gerentes que frecuentemente quieren una vista de datos de nivel superior, como las ventas totales por línea de producto, por región, etc. Las bases de datos OLAP normalmente se actualizan en lote, a menudo de múltiples fuentes, y proporcionan un back-end analítico poderoso a las aplicaciones de múltiples usuarios. Por tanto, las bases de datos OLAP se perfeccionan para el análisis.

bibliografia:http://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx
https://oltp.wikispaces.com/Diferencia+entre+OLTP+y+OLAP




Base de datos Multidimensionales


Una base de datos multidimensional (MDB) es un tipo de base de datos que se ha optimizado para data warehouse y aplicaciones de procesamiento analítico en línea (OLAP). Las bases de datos multidimensionales se crean con frecuencia usando entradas de las bases de datos relacionales existentes. Mientras que a una base de datos relacional se accede normalmente mediante una consulta de Lenguaje de Consulta Estructurado (SQL), una base de datos multidimensional permite a un usuario hacer preguntas como: "¿Cuántas Aptivas se han vendido en Nebraska en lo que va del año?" y cuestiones similares relacionadas a resumir operaciones y tendencias de negocios. A una aplicación OLAP que accede a los datos desde una base de datos multidimensional se le conoce como una aplicación MOLAP (OLAP multidimensional).

Ventajas y desventajas de una base de datos multidimensional

Una base de datos multidimensional presenta varias ventajas:Utiliza un espacio en disco menor porque está comprimido y no utiliza la  indexación para buscar datos.

Tiene mejores prestaciones sirviendo necesidades al usuario ya que los datos agregados son precalculados y el formato de almacenamiento reduce el número de operaciones de entrada y salida.
Garantiza un rendimiento superior porque se modelan teniendo en cuenta sólo los requisitos de un solo grupo de usuarios.
Soporta un acceso, directo, eficiente y rápido a los datos.
Sin embargo, una base de datos multidimensional también tiene desventajas:
El tiempo de procesamiento de los datos es alto ya que los datos agregados deben recalcularse cuando se actualizan las fuentes de datos operacionales.
La escalabilidad disminuye a medida que aumenta el número de dimensiones o cuando la base de datos es muy grande.
La flexibilidad de una base de datos multidimensional es muy baja.
El alcance del diseño es limitado, por lo tanto, a medida que aumenta el número de grupos de usuarios cuyos requerimientos deben ser tomados en cuenta, el modelo corre el riesgo de fallar.

Ejemplos 1 (BRISTOL-MYERS)
 La farmacéutica estadounidense Bristol-Myers Squibb redujo en un 98% el tiempo que se tarda en ejecutar simulaciones de ensayos clínicos mediante la implementación de un entorno de red alojado internamente en los sistemas cloud de AWS (Amazon Web Services). Además, la compañía también ha sido capaz de optimizar los niveles de dosificación de los medicamentos, hacer que éstos sean más seguros y que los ensayos clínicos requieran un menor número de muestras de sangre de los pacientes. Dado que el tema de los ensayos clínicos se refieren a datos muy sensibles, Bristol-Myers Squibb construyó una pasarela encriptada para conectarse a los sistemas de Amazon y se configuró un entorno de nube privada virtual para aislar los datos y mantenerlos en privado.
Antes de pasar a la nube, los científicos utilizaban un entorno interno compartido, por lo que fueron necesarias 60 horas para la migración, teniendo en cuenta que la empresa tiene cientos de puestos de trabajo. Ahora que cada científico tiene un entorno dedicado, el sistema puede procesar 2.000 instrucciones en poco más de una horas sin causar impacto en los otros miembros del equipo. Como resultado de estos cambios, Bristol-Myers Squibb fue capaz de reducir el número de sujetos necesarios para un ensayo clínico de un producto pediátrico de 60 a 40, al tiempo que acortaba la duración del estudio en más de un año.

Ejemplo 2 (THE WEATHER COMPANY E IBM)
Una reciente joint venture entre The Weather Company e IBM permitirá gestionar mejor el impacto del clima sobre el rendimiento de un negocio. Y es que, según afirma la empresa de meteorología, el clima tiene un impacto económico de medio billón de dólares al año sólo en los EEUU.
Los datos sobre climatología están siendo recogidos por más de 100.000 sensores y aviones meteorológicos, así como millones de teléfonos inteligentes, edificios y vehículos en movimiento. Esos datos se combinan con los de otras fuentes para lograr 2,2 millones de puntos de pronóstico únicos, y un promedio de más de 10 mil millones de pronósticos del tiempo en un día activo. Datos que las empresas dirigidas al consumidor final pueden utilizar para ajustar sus necesidades de personal y sus cadenas de suministro, las energéticas para mejorar su oferta y conocer la previsión de la demanda, y las compañías de seguros para advertir a los titulares de pólizas que incluyan daños por condiciones climáticas severas (logrando con ello minimizar la posibilidad de daños en sus coches en caso de una tormenta de granizo, por ejemplo).

bibliográfia:

http://www.ticbeat.com/empresa-b2b/casos-exito-aplicacion-big-data/4/
http://searchdatacenter.techtarget.com/es/definicion/Base-de-datos-multidimensional-MDB
https://blog.powerdata.es/el-valor-de-la-gestion-de-datos/rol-de-la-base-de-datos-multidimensional-en-las-organizaciones-modernas
http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-56092006000300016

Bodega de datos

Data Warehouse Es un conjunto de datos integrados u orientados a una materia, que varían con el tiempo y que no son transitorios, los cu...