Plataformas DSML: ciencia de datos a escala industrial

Si Open Source y Python están a la vanguardia en la ciencia de datos, los editores ofrecen plataformas para organizar la creación y el mantenimiento de modelos de IA. Una etapa clave en la maduración de la IA en los negocios.

Los datos están en el corazón de la estrategia de transformación de las empresas, y la implementación de la inteligencia artificial promete importantes ganancias de productividad en muchas empresas. Los más avanzados han creado células de ciencia de datos y laboratorios de inteligencia artificial para realizar experimentos e introducir los primeros algoritmos, pero rápidamente surge la pregunta acerca de escalar estas instituciones.

La creación de modelos de inteligencia artificial “en línea” por parte de científicos de datos para las líneas de negocio, así como el seguimiento del rendimiento de estos algoritmos a lo largo del tiempo, requiere un mínimo de herramientas. Muchos editores se han posicionado en un mercado llamado DSML de Gartner, abreviatura de (plataformas) Data Science & Machine Learning.

Dataiko: un francés entre los líderes

Jean-Claude Ravino Dataiko

Entre los líderes de este mercado se encuentra el joven francés dataco. La editorial ha recaudado casi $ 247 millones desde su creación en 2013 y cuenta con GE Aviation entre sus primeros clientes, al igual que La Mutuelle Générale, Showroom Privé, Levi’s y NXP Semiconductors.

Recientemente, Dataiku lanzó una versión en línea de su plataforma, una oferta de SaaS dirigida, en particular, a las pequeñas empresas. “El cambio a la nube ha hecho posible que las pequeñas empresas utilicen la plataforma sin la necesidad de habilidades específicas del sistema”, dijo Jean-Claude Ravino, director senior de gestión de productos.

La competencia es particularmente alta, con jugadores puros y genéricos, pero también con proveedores de la nube que desean atraer a la mayor cantidad posible de científicos de datos a sus plataformas. Todos los supercondensadores también están en el mercado. Si bien Google Cloud se beneficia de la excelente imagen de sus herramientas de inteligencia artificial, AWS, Microsoft Azure y Alibaba Cloud ofrecen soluciones alternativas.

La ventaja de su oferta es la integración de estas herramientas en el ecosistema de nube de todos, con el riesgo real de un “seguro de proveedor”. La elección de un servicio en la nube que contenga el lago de datos tiene un fuerte impacto en la plataforma DSML que se implementará.

Aparentemente, los editores “históricos” de lo que se llamó minería de datos se han sumado a la refriega. IBM confía en la sólida reputación de Watson para impulsar su oferta de Watson Studio y Campeón de SAS Analytics Promueve su plataforma Viya a sus clientes históricos, con una oferta que admite tanto SAS como Python.

Jugadores de minería de datos en batalla

Rémi Griveau, asesor de visualización de datos y BI ágil en SAS, destaca: “La oferta está dirigida a todas las empresas, tengan o no una cultura SAS. Esta cultura es un acelerador para la adopción, especialmente porque estos clientes tienen la oportunidad de aprovechar las SAS existentes”. El experto destaca que la última versión “Cloud-Native” de SAS Viya debería simplificar las pequeñas implementaciones de pequeñas empresas o proyectos de destino.

Cada plataforma tiene sus fortalezas y debilidades, ya sea en la adquisición y preparación de datos, el soporte de aprendizaje automático o las herramientas colaborativas disponibles para los científicos de datos y los usuarios comerciales.

Sin embargo, todas estas ofertas se combinan en los componentes de código abierto que se incluyen. Este es particularmente el caso de las bibliotecas de aprendizaje automático / aprendizaje profundo de Python, así como de los cuadernos de Jupyter que ofrecen carpetas digitales en las que se almacenan todos los elementos del proyecto modelo.

Si bien el mercado de las soluciones DSML ciertamente se concentrará en los próximos años, ofrece una amplia gama de enfoques y soluciones que ya permiten alcanzar la madurez en el despliegue de IA en las empresas.

Experto en decodificación

Sheriman Tiwari – Kyros

“La ventaja de la plataforma DSML es reducir el tiempo de DevOps, es decir, el tiempo necesario para configurar el entorno de desarrollo y los servidores. El tiempo de instalación es rápido y los costos de implementación son relativamente bajos.

Así, las organizaciones pueden dedicar su tiempo a desarrollar algoritmos y pueden ser más eficientes.
Además, el tiempo de implementación de la herramienta se reduce gracias a las herramientas ya integradas en las plataformas. Por ejemplo, en Google Cloud Platform y Microsoft Azure, es muy fácil compilar e implementar la solución. “

Sheriman Tiwari – Jefe de ciencia de datos / Ingeniería de datos chez kiros

Productos químicos Eeedine Nabti – Ippon Technologies

Se recomienda encarecidamente una auditoría inicial para identificar los casos de uso y los objetivos de los proyectos de aprendizaje automático y ciencia de datos.
La plateforme doit être choisie en función de la quantité de données, du niveau de sécurité souhaité selon la sensibilité des données, mais aussi de la taille de l’équipe Data Science & ML, le budget, les nature contempla en termes Projects.
Aprendizaje profundo, procesamiento de imágenes, etc. Requiere recursos informáticos potentes en comparación con el aprendizaje automático y los algoritmos más tradicionales. Todos estos criterios serán claves que ayudarán a la empresa a elegir la herramienta adecuada que contenga todos los servicios necesarios para hacer DS & ML, o un conjunto de herramientas que cubran expectativas y satisfagan mejor las necesidades del negocio. “

Chems Eeedine Nabti – Jefe científico de datos chez Tecnologías EPON

Las principales funciones de la plataforma DSML

  • Definición de necesidad
  • Ingesta de datos
  • preparación de datos
  • Explore datos con herramientas interactivas
  • Ingeniería de características (extracción de información de datos sin procesar)
  • Crear y entrenar modelos de inteligencia artificial
  • modelos de prueba
  • Proliferación de modelos en producción
  • Modelos de monitor
  • Mantenimiento de formularios
  • Gobierno de datos y modelos
  • Bloque declarativo para modelos de inteligencia artificial (XAI)
  • Control de valor empresarial
  • Trabajos de colaboración

Ofertas del mercado principal

Editores de soluciones

Nube de Alibaba Plataforma de Inteligencia Artificial, Taller de Ciencia de Datos

Altair El conocimiento está funcionando

Trix Plataforma Alteryx APA.

Servicios web de Amazon Amazon Sigmaker

anaconda Edición empresarial Anaconda

clodera Aprendizaje automático de Cloudera

Databriks Plataforma de datos unificada

dataco estudio de ciencia de datos

robot de datos Plataforma AI DataRobot Enterprise.

dominó Plataforma de ciencia de datos de Domino

Google Google Plataforma de inteligencia artificial en la nube

H2O.ai IA sin conductor H2O

IBM IBM Watson Studio

KNIME Plataforma de análisis KNIME

Mathworks Matlab

Microsoft Aprendizaje automático de Azure

RapidMiner Estudio RapidMiner

Samsung SDS Brightics AI

hablar con descaro a SAS Viya

Tibco. Software Plataforma Tibco Data Science

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *