CatBoost: l'algorithme d'apprentissage automatique de Yandex disponible gratuitement

catboost.yandex
Le géant russe de l'Internet Yandex a lancé CatBoost, un service d'apprentissage automatique en open source. L'algorithme a déjà été intégré par l'Organisation européenne pour la recherche nucléaire afin d’analyser les données du Grand collisionneur de Hadrons, l'installation expérimentale la plus sophistiquée du monde.

Crédit : catboost.yandexCrédit : catboost.yandex

L'apprentissage automatique aide à prendre des décisions en analysant les données et peut être utilisé dans de nombreux domaines, comme la reconnaissance faciale. Yandex, l'une des plus importantes sociétés technologiques russes, a créé son algorithme d’apprentissage automatique avancé, CatBoost, disponible gratuitement pour les développeurs du monde entier.

« C'est la première technologie d'apprentissage automatique russe qui est en code source ouvert », a déclaré Mikhaïl Bilenko, le chef de l'intelligence et de la recherche sur les machines de Yandex.

Qu'est-ce que les chats ont à voir avec ça?

CatBoost n'est pas un « chat » ordinaire. En fait, l’expression signifie « stimulation catégorique »: l'algorithme fonctionne non seulement avec des nombres, mais aussi avec bien d’autres « catégories » de données, telles que l'audio, le texte ou l'image, y compris des données historiques.

« CatBoost est basé sur le gradient boosting, une technologie d'apprentissage automatique qui fonctionne très bien avec des données provenant de différentes sources », a déclaré Anna-Veronika Dorogouch, responsable du développement des systèmes d'apprentissage automatiques chez Yandex.

L'algorithme, par exemple, est idéal pour les prévisions météorologiques, domaine dans lequel il est important d'analyser tout un éventail de données historiques, de modèles climatiques et de données météorologiques. Yandex utilise déjà CatBoost dans le cadre de son service de prévision météorologique afin d'en améliorer la précision.

Contribution à l'apprentissage automatique

Selon Yandex, l'algorithme s'est révélé efficace dans différents domaines, y compris la banque et la production. CatBoost a notamment aidé un client à améliorer la qualité de son acier.

« La plupart des algorithmes d'apprentissage automatique ne fonctionnent qu'avec des données numériques, telles que la hauteur, le poids ou la température », a expliqué Mme Dorogouch. D'autres données, telles que les types de nuages ​​ou de bâtiments, devaient être « traduites » en nombres avant que les développeurs ne puissent l'utiliser. Mais parfois, l'information est perdue au cours du processus, ce qui a un impact sur le résultat final.

« Nous avons mis CatBoost en code source ouvert pour donner aux scientifiques du monde entier un instrument simple et précis, a déclaré M. Bilenko. C'est notre contribution au développement de l'apprentissage automatique ».

Lire aussi : 

L’intelligence artificielle Made in Russia veut faire de l’ombre à Google et Amazon

Véhicules autonomes: trois technologies venues de Russie

Dans le cadre d'une utilisation des contenus de Russia Beyond, la mention des sources est obligatoire.

À ne pas manquer