Нейронку научили правильно называть органические соединения

Нейронку научили правильно называть органические соединения

😢 Проблема: для названий органических соединений используют международный язык — номенклатуру ИЮПАК. Название должно полностью отражать химическую структуру, поэтому может быть очень громоздким. 

Ошибка даже в одном символе будет критичной, поэтому от химиков требуется внимательность и знание многочисленных правил языка. На рынке есть коммерческие продукты для автоматической генерации названий, но нет программ под свободной лицензией.

😎 Решение:  нейросеть для генерации названий органических соединений. За основу взяли Transformer, нейросеть Google для машинного перевода с одного языка на другой. Для обучения и тестирования использовали самую большую открытую базу PubChem, которая содержит около 100 миллионов соединений.

Созданная примерно за полтора месяца нейросеть способна переводить названия почти с той же точностью, что и алгоритмические решения на базе химических правил.

👨‍💻 Кто: исследователи Сколковского института науки и технологий, МГУ им. М. В. Ломоносова и стартапа Syntelly, Россия.

Источники: skoltech.ru и nature.com

Получите ИТ-профессию
В «Яндекс Практикуме» можно стать разработчиком, тестировщиком, аналитиком и менеджером цифровых продуктов. Первая часть обучения всегда бесплатная, чтобы попробовать и найти то, что вам по душе. Дальше — программы трудоустройства.
Получите ИТ-профессию Получите ИТ-профессию Получите ИТ-профессию Получите ИТ-профессию
Вам может быть интересно
[Посмотрите] первые испытания летающего гоночного беспилотника
[Посмотрите] первые испытания летающего гоночного беспилотника

Новое поколение гоночного спорта.

Google добавит фактчекинг для изображений
Google добавит фактчекинг для изображений

Google продолжает бороться с дезинформацией. На этот раз через картинки.

[Почитайте] как алгоритмы проектируют крутые здания
[Почитайте] как алгоритмы проектируют крутые здания

Алгоритмы не только рисуют логотипы, но и занимаются полезными делами.

Собрали датасет для прогнозирования траектории движения людей и машин
Собрали датасет для прогнозирования траектории движения людей и машин
Инженеры создали фотонный процессор, передающий данные со скоростью света
Инженеры создали фотонный процессор, передающий данные со скоростью света
Изобрели сверхлёгкий ударопрочный материал из углерода
Изобрели сверхлёгкий ударопрочный материал из углерода
Российская нейронка выявляет СДВГ у собак
Российская нейронка выявляет СДВГ у собак
Сделали инструмент для создания реалистичных цифровых персонажей
Сделали инструмент для создания реалистичных цифровых персонажей

Делать трёхмерную анимацию станет проще и дешевле.

Anthropic остановила кибератаку, где ИИ работал почти автономно
Anthropic остановила кибератаку, где ИИ работал почти автономно

Плохой мальчик

easy