Plataformas DSML: ciencia de datos a escala industrial
Si Open Source y Python están a la vanguardia en la ciencia de datos, los editores ofrecen plataformas para organizar la creación y el mantenimiento de modelos de IA. Una etapa clave en la maduración de la IA en los negocios.
Los datos están en el corazón de la estrategia de transformación de las empresas, y la implementación de la inteligencia artificial promete importantes ganancias de productividad en muchas empresas. Los más avanzados han creado células de ciencia de datos y laboratorios de inteligencia artificial para realizar experimentos e introducir los primeros algoritmos, pero rápidamente surge la pregunta acerca de escalar estas instituciones.
La creación de modelos de inteligencia artificial “en línea” por parte de científicos de datos para las líneas de negocio, así como el seguimiento del rendimiento de estos algoritmos a lo largo del tiempo, requiere un mínimo de herramientas. Muchos editores se han posicionado en un mercado llamado DSML de Gartner, abreviatura de (plataformas) Data Science & Machine Learning.
Dataiko: un francés entre los líderes
Entre los líderes de este mercado se encuentra el joven francés dataco. La editorial ha recaudado casi $ 247 millones desde su creación en 2013 y cuenta con GE Aviation entre sus primeros clientes, al igual que La Mutuelle Générale, Showroom Privé, Levi’s y NXP Semiconductors.
Recientemente, Dataiku lanzó una versión en línea de su plataforma, una oferta de SaaS dirigida, en particular, a las pequeñas empresas. “El cambio a la nube ha hecho posible que las pequeñas empresas utilicen la plataforma sin la necesidad de habilidades específicas del sistema”, dijo Jean-Claude Ravino, director senior de gestión de productos.
La competencia es particularmente alta, con jugadores puros y genéricos, pero también con proveedores de la nube que desean atraer a la mayor cantidad posible de científicos de datos a sus plataformas. Todos los supercondensadores también están en el mercado. Si bien Google Cloud se beneficia de la excelente imagen de sus herramientas de inteligencia artificial, AWS, Microsoft Azure y Alibaba Cloud ofrecen soluciones alternativas.
La ventaja de su oferta es la integración de estas herramientas en el ecosistema de nube de todos, con el riesgo real de un “seguro de proveedor”. La elección de un servicio en la nube que contenga el lago de datos tiene un fuerte impacto en la plataforma DSML que se implementará.
Aparentemente, los editores “históricos” de lo que se llamó minería de datos se han sumado a la refriega. IBM confía en la sólida reputación de Watson para impulsar su oferta de Watson Studio y Campeón de SAS Analytics Promueve su plataforma Viya a sus clientes históricos, con una oferta que admite tanto SAS como Python.
Jugadores de minería de datos en batalla
Rémi Griveau, asesor de visualización de datos y BI ágil en SAS, destaca: “La oferta está dirigida a todas las empresas, tengan o no una cultura SAS. Esta cultura es un acelerador para la adopción, especialmente porque estos clientes tienen la oportunidad de aprovechar las SAS existentes”. El experto destaca que la última versión “Cloud-Native” de SAS Viya debería simplificar las pequeñas implementaciones de pequeñas empresas o proyectos de destino.
Cada plataforma tiene sus fortalezas y debilidades, ya sea en la adquisición y preparación de datos, el soporte de aprendizaje automático o las herramientas colaborativas disponibles para los científicos de datos y los usuarios comerciales.
Sin embargo, todas estas ofertas se combinan en los componentes de código abierto que se incluyen. Este es particularmente el caso de las bibliotecas de aprendizaje automático / aprendizaje profundo de Python, así como de los cuadernos de Jupyter que ofrecen carpetas digitales en las que se almacenan todos los elementos del proyecto modelo.
Si bien el mercado de las soluciones DSML ciertamente se concentrará en los próximos años, ofrece una amplia gama de enfoques y soluciones que ya permiten alcanzar la madurez en el despliegue de IA en las empresas.
Experto en decodificación
“La ventaja de la plataforma DSML es reducir el tiempo de DevOps, es decir, el tiempo necesario para configurar el entorno de desarrollo y los servidores. El tiempo de instalación es rápido y los costos de implementación son relativamente bajos.
Así, las organizaciones pueden dedicar su tiempo a desarrollar algoritmos y pueden ser más eficientes.
Además, el tiempo de implementación de la herramienta se reduce gracias a las herramientas ya integradas en las plataformas. Por ejemplo, en Google Cloud Platform y Microsoft Azure, es muy fácil compilar e implementar la solución. “
Sheriman Tiwari – Jefe de ciencia de datos / Ingeniería de datos chez kiros
Se recomienda encarecidamente una auditoría inicial para identificar los casos de uso y los objetivos de los proyectos de aprendizaje automático y ciencia de datos.
La plateforme doit être choisie en función de la quantité de données, du niveau de sécurité souhaité selon la sensibilité des données, mais aussi de la taille de l’équipe Data Science & ML, le budget, les nature contempla en termes Projects.
Aprendizaje profundo, procesamiento de imágenes, etc. Requiere recursos informáticos potentes en comparación con el aprendizaje automático y los algoritmos más tradicionales. Todos estos criterios serán claves que ayudarán a la empresa a elegir la herramienta adecuada que contenga todos los servicios necesarios para hacer DS & ML, o un conjunto de herramientas que cubran expectativas y satisfagan mejor las necesidades del negocio. “
Chems Eeedine Nabti – Jefe científico de datos chez Tecnologías EPON
Las principales funciones de la plataforma DSML
- Definición de necesidad
- Ingesta de datos
- preparación de datos
- Explore datos con herramientas interactivas
- Ingeniería de características (extracción de información de datos sin procesar)
- Crear y entrenar modelos de inteligencia artificial
- modelos de prueba
- Proliferación de modelos en producción
- Modelos de monitor
- Mantenimiento de formularios
- Gobierno de datos y modelos
- Bloque declarativo para modelos de inteligencia artificial (XAI)
- Control de valor empresarial
- Trabajos de colaboración
Ofertas del mercado principal
Editores de soluciones
Nube de Alibaba Plataforma de Inteligencia Artificial, Taller de Ciencia de Datos
Altair El conocimiento está funcionando
Trix Plataforma Alteryx APA.
Servicios web de Amazon Amazon Sigmaker
anaconda Edición empresarial Anaconda
clodera Aprendizaje automático de Cloudera
Databriks Plataforma de datos unificada
dataco estudio de ciencia de datos
robot de datos Plataforma AI DataRobot Enterprise.
dominó Plataforma de ciencia de datos de Domino
Google Google Plataforma de inteligencia artificial en la nube
H2O.ai IA sin conductor H2O
IBM IBM Watson Studio
KNIME Plataforma de análisis KNIME
Mathworks Matlab
Microsoft Aprendizaje automático de Azure
RapidMiner Estudio RapidMiner
Samsung SDS Brightics AI
hablar con descaro a SAS Viya
Tibco. Software Plataforma Tibco Data Science
“Alborotador. Amante de la cerveza. Total aficionado al alcohol. Sutilmente encantador adicto a los zombis. Ninja de twitter de toda la vida”.
