Los orígenes

Allá por el año 2013 SAP adquirió una compañía llamada Kxen que estaba centrada en el mercado de software de analítica predictiva. Kxen tenía un producto denominado Infinite Insight que automatizaba ciertas tareas de analítica predictiva lo que permitía que fuera utilizada tanto por perfiles profesionales (data scientist) como por usuarios avanzados de negocio. Las principales funcionalidades eran las siguientes:

  • Datamanager: Permite realizar todas las tareas relativas a la fase de data preparation (Selección de datos, limpieza, construcción de nuevas características, etc.).
Data Manager
  • Modeler: Permite desarrollar modelos predictivos para clasificaciones, regresiones, clustering, series temporales, Social Network Analysis (SNA) y recomendación de productos. En el desarrollo de los modelos aplica técnicas para tratar el encoding de las variables, las correlaciones, auto selección de variables más representativas y gestión del overfitting mediante técnicas de minimización del error.
Curva ROC Modelo de Clasificación
  • Apply Model: Funcionalidad que permite aplicar el modelo construido previamente sobre el data set definitivo.

En los años siguientes SAP incorporó este producto a su portfolio de analítica predictiva y lo denominó SAP Predictive Analysis, además lo desarrolló como un componente para la base de datos HANA y los denominó APL o Automated Predictive Library.

En paralelo y a partir de la aparición de SAP Analytics cloud, SAP implementó el APL como motor de analítica predictiva empleándose con las funcionalidades de Augmented Analytics y Predictive Forecasting.

Que es SAP APL

SAP HANA APL es por tanto una librería que contiene la implementación de esos algoritmos automáticos provenientes de Infinite Insight directamente en base de datos con los siguientes objetivos destacados:

  • Que puedan aplicarse sobre los datos de las tablas (datos ERP, S4HANA) sin necesidad de mover o extraer la información a otras herramientas o frameworks.
  • Complementar las capacidades de machine learning de HANA, de modo que el PAL queda orientado a perfiles Data scientist mientras que el APL puede ser utilizado por analistas o desarrolladores con menor conocimiento de minería de datos.
  • Ofrecer funcionalidades de machine learning en los nuevos productos (SAC, C4HANA, S4HANA, etc.)

Que nos ofrece SAP Hana APL

  • Modelos de Clasificación: Aplica técnicas de regresión para identificar la categoría de una nueva observación basándose en datos de entrenamiento, en este caso la variable a predecir debe ser de tipo booleano (si / no, compra no compra, etc.).
Clasificación
  • Modelos de Regresión: Aplica técnicas de regresión para identificar la categoría de una nueva observación basándose en datos de entrenamiento, en este caso la variable a predecir debe ser de tipo continuo (importe, etc.).
Regresión
  • Modelos de Clustering: Aplica técnicas de clustering que permite agrupar objetos en grupos que presentan características homogéneas o similares, determina automáticamente el número óptimo de clusters.
Clustering
  • Modelos de Series Temporales: Aplica técnicas de modelización de series temporales para realizar una estimación de valores para periodos futuros.
Series Temporales
  • Modelos de Social Network Analysis (SNA): Aplica técnicas de social análisis para identificar y analizar relaciones entre nodos, detectar y predecir propagación entre nodos, detectar comunidades y roles de los nodos, etc.
Social Graph

Como Funciona

El APL permite que sus algoritmos puedan ser invocados a través de APL Wrappers de SQL, a través de un procedimientos de SQL script, Python o a través de las herramientas de SAP Predictive Analysis.

APL Wrapper
SQL script
APL Python API

En definitiva, toda la funcionalidad que nos ofrece el APL va orientada a que estos algoritmos puedan aplicarse directamente en la base de datos, de forma automática o semiautomática reduciendo los tiempos de implementación, simplificando los conocimientos para poder emplearlos y con el objetivo de que el resultado pueda ser “consumido” por el usuario vía aplicaciones (Fiori, etc.) o datos.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios .