Новые работы по машинному обучению: анализ и тенденции
Конференция: XXII Международная научно-практическая конференция «Научный форум: инновационная наука»
Секция: Технические науки
XXII Международная научно-практическая конференция «Научный форум: инновационная наука»
Новые работы по машинному обучению: анализ и тенденции
RECENT MACHINE LEARNING PAPERS: ANALYSIS AND TENDENCIES
Vsevolod Maltsev
Graduate student, Rostov State Economic University (RSUE), Russia, Rostov-on-Don
Аннотация. Автор анализирует статьи по машинному обучению. Приведены примеры заметных работ, а также их влияние на сферу в целом и на перспективы будущих исследований.
Abstract. The author analyzes recent machine learning papers. Examples of notable papers are given, as well as their effects on the sphere as a whole and on prospects of future studies.
Ключевые слова: Машинное обучение; информационные технологии; внедрение технологий; нейронные сети; большие данные.
Keywords: Machine learning; information technologies; technology implementation; neural networks; big data.
Введение
Дисциплина машинного обучения стремительно развивается. За последние несколько лет вышло большое количество работ, как двигающих теоретические аспекты вперед, так и внедряющие их в разные аспекты наших жизней.
Работы рассматривают как новые методики и подходы, так и оптимизации существующих.
Проанализировав такие работы, можно выделить ключевые точки развития области и позволит выявить ограничения, с которыми столкнулись исследователи.
Материалы и методы
Целью исследования является выделение направления развития научных работ по машинному обучению, а также выявлению сдерживающих факторов, которые ограничивают дальнейшее продвижение и развитие области в целом.
В этой работе будут рассмотрены некоторые работы по машинному обучению за прошедший год. Будет проведен анализ результатов, а также обозначены факторы, ограничивающие дальнейшее улучшение методик и результатов.
Результаты и обсуждение
Были проанализированы 20 популярных работ в сфере машинного обучения за 2018 год. Каждая привносит свой вклад в развитие этой области. От новых методологий, до мета-исследований, до экскурсов в историю, каждая из работ преследует одну из целей:
- Улучшить качество работы существующих методик;
- Предложить новые методики;
- Проанализировать суть методов, чтобы найти новые подходы;
Из всех проанализированных работ, 9 предлагают новые методики, 7 проводят анализ прошлых работ, и 4 анализируют эволюцию различных областей машинного обучения.
Рассматривая первую группу, предлагающую новые методики, 1 работа представляла новую библиотеку для работы с многомерными объектами [13], 5 предлагали методы по улучшению определенного шага в обучении сети: шага обратного распространения ошибки и функций потери [3, 6, 8, 15, 18], и 3 предлагали новые подходы к обучению [10, 11, 19].
Во второй группе, предлагающей обзорные материалы, 4 связаны с глубокими сетями [7, 12, 14, 20] и 3 относятся к пониманию текста и языка [4, 5, 9].
В третьей группе рассматривается история развития разных аспектов машинного обучения. 3 из них рассматривают разные модели нейронных сетей [1, 16, 17]. Одна рассматривает эволюцию методики обратного распространения ошибки [2].
Из анализа работ следует, что в данный момент относительно небольшое количество работ предоставляет новые методы машинного обучения. Большинство работ сосредоточены на оптимизации скорости обучения сетей и анализе существующих решений. Из этого следует, что на данный момент методы являются оптимальными, и происходит волна оптимизации. Это продлится до появления принципиально нового метода построения, обучения нейронных сетей, или даже перемены подходов к машинному обучению.
Также, за последнее время подавляющее количество работ связано либо с глубокими сетями, либо с семантическим анализом текста. Именно эти два направления получили больший скачок в развитии и в качестве вывода сетей.
Выводы
В данной работе были проанализированы работы по машинному обучению за прошедший год. Были выявлены тенденции и популярные темы, которые показали, что работ, описывающих качественно новые методы, гораздо меньше, чем работ, описывающих оптимизации существующих. Это связано с пока что большей выгодой от оптимизаций, нежели от поиска принципиально новых методов и подходов.
С увеличением производительности вычислительной техники, возможно, найдутся более оптимальные подходы и методы, которые покажут более высокие результаты нежели существующие. До этого момента будет происходить оптимизация существующих решений.
С уменьшением пользы от оптимизаций, больше сил будет переброшено на поиск альтернативных путей улучшения выводов сетей, как параллелизация обучения, или нахождение принципиально новых методов и подходов.