МОДЕЛЮВАННЯ ТЕМАТИЧНИХ ТРЕНДІВ У УКРАЇНОМОВНИХ ДОПИСАХ СОЦІАЛЬНИХ МЕРЕЖ ЗАСОБАМИ ЛІНГВІСТИЧНИХ ЕМБЕДИНГІВ ТА ІЄРАРХІЧНОЇ КЛАСТЕРИЗАЦІЇ
Опубліковано 23.05.2025
Як цитувати
Завантаження
Авторське право (c) 2025 Роман Линник, Вікторія Висоцька

Ця робота ліцензується відповідно до Creative Commons Attribution-ShareAlike 4.0 International License.
Анотація
Упродовж останнього десятиліття соціальні мережі стали провідною платформою формування й трансляції суспільно значущих поглядів. Особливої актуальності набуває дослідження україномовного контенту, що активно продукується в Telegram-каналах. Інформаційна динаміка в таких мережах є високочастотною, тематично змінною і часто емоційно забарвленою, що ускладнює аналітичне узагальнення вручну. Саме тому важливим завданням стає створення автоматизованих методів семантичного структурування таких текстів для виявлення актуальних трендів.
Посилання
- 1. Feng, F., Yang, Y., Cer, D., Arivazhagan, N., Wang, W. Language-Agnostic BERT Sentence Embedding [Електронний ресурс] / F. Feng, Y. Yang, D. Cer, N. Arivazhagan, W. Wang. –
- 2020. – Режим доступу: https://arxiv.org/abs/2007.01852.
- 2. McInnes, L., Healy, J., Astels, S. hdbscan: Hierarchical density based clustering // Journal of Open Source Software. – 2017. – Vol. 2, No. 11. – P. 205. DOI: https://doi.org/10.21105/joss.00205.
- 3. Rokach, L., Maimon, O. Clustering Methods // Data Mining and Knowledge Discovery Handbook / L. Rokach, O. Maimon. – New York : Springer, 2005. – P. 321–352.
- 4. Qi, P., Zhang, Y., Zhang, Y., Bolton, J., Manning, C. D. Stanza: A Python NLP Library for Many Human Languages // Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics: System Demonstrations. – 2020. – P. 101–108. DOI: https://doi.org/10.18653/v1/2020.acl-demos.14.
- 5. McInnes, L., Healy, J., Melville, J. UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction [Електронний ресурс] / L. McInnes, J. Healy, J. Melville. – 2018. – Режим доступу: https://arxiv.org/abs/1802.03426.