Please use this identifier to cite or link to this item:
https://er.nau.edu.ua/handle/NAU/53762
Title: | Програмне забезпечення для збору та аналізу даних з веб сайтів |
Authors: | Петров, Андрій Васильович |
Keywords: | дипломна робота технології проектування програмне забезпечення веб сайт java аналіз даних |
Issue Date: | 23-Dec-2021 |
Publisher: | Національний авіаційнй унівкрситет |
Abstract: | Збір даних з метою подальшої аналітики або парсинг – це метод індексування даних з наступним перетворенням їх в інший тип даних або формат. Даний метод дозволяє інформацію або файл в одному форматі перетворити в форму простішу для сприйняття, яку після цього можна використовувати в певних цілях. Наприклад, за допомогою парсингу HTML-файл можна легко трансформувати в «чистий» текст і таким чином зробити його максимально зручним для читання. Або ж перетворити в JSON і зробити зручним для використання у програмах та скриптах. В даній роботі поняття парсинг розглядається в більш вузькій області, а саме збір даних з веб-сайтів. Тому йому можна дати точніше визначення. Отже, парсинг – це процес та метод обробки даних отриманих з веб-сторінок. Даний процес включає в себе аналіз тексту, екстракцію звідти необхідної інформації і її перетворення в заздалегідь зазначений формат, який можна використовувати відповідно до поставлених цілей. Завдяки парсингу можна знаходити на сторінках невеликі клаптики корисної інформації і в автоматичному режимі їх звідти витягувати, щоб потім перевикористати. |
Description: | Робота публікується згідно наказу Ректора НАУ від 27.05.2021 р. №311/од "Про розміщення кваліфікаційних робіт здобувачів вищої освіти в репозиторії університету". Керівник проекту: доцент, кандидидат технічних наук, Сінько Юрій Іванович. |
URI: | https://er.nau.edu.ua/handle/NAU/53762 |
Appears in Collections: | Кваліфікаційні роботи здобувачів вищої освіти кафедри комп’ютерних інформаційних технологій |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ФККПІ_2021_122_ПетровАВ.docx | 3.9 MB | Microsoft Word XML | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.