Розбіжності

Тут показані розбіжності між вибраною ревізією та поточною версією сторінки.

Посилання на цей список змін

Порівняння попередніх версій Попередня ревізія
Наступна ревізія
Попередня ревізія
subjects:basic:informatika:infsecurity:technical_and_software_tools_for_information_extraction [01.12.2024 19:42] Адміністраторsubjects:basic:informatika:infsecurity:technical_and_software_tools_for_information_extraction [01.12.2024 19:43] (поточний) – [Web scraping] Адміністратор
Рядок 35: Рядок 35:
 **Вебскрейпінг** (англ. scraping — «вишкрібання», вебзбирання або витягнення вебданих) —  це процес збору даних з вебсайтів. За допомогою спеціальних програм, скриптів, а інколи і ручного копіювання зловмисник отримує структуровані дані, які можуть бути використані для аналізу, досліджень чи інтеграції в інші системи. **Вебскрейпінг** (англ. scraping — «вишкрібання», вебзбирання або витягнення вебданих) —  це процес збору даних з вебсайтів. За допомогою спеціальних програм, скриптів, а інколи і ручного копіювання зловмисник отримує структуровані дані, які можуть бути використані для аналізу, досліджень чи інтеграції в інші системи.
  
-Етапи Вебскрейпінг: +Етапи Вебскрейпінгу
-  - Завантаження сторінки +  - **Завантаження сторінки** \\ Скрейпер відправляє HTTP-запит до вебсайту і отримує HTML-код сторінки. 
-    - Скрейпер відправляє HTTP-запит до вебсайту і отримує HTML-код сторінки. +  - **Аналіз HTML** \\ Отримані дані обробляються для вилучення потрібної інформації, наприклад, тексту, зображень, посилань. 
-  - Аналіз HTML +  - **Збереження даних** \\ Витягнуті дані зберігаються у зручному форматі (CSV, Excel; База даних; Інший формат, залежно від завдання).
-    - Отримані дані обробляються для вилучення потрібної інформації, наприклад, тексту, зображень, посилань. +
-  - Збереження даних +
-    - Витягнуті дані зберігаються у зручному форматі (CSV, Excel; База даних; Інший формат, залежно від завдання).+
  
 ==== Sniffing (Аналіз трафіку) ==== ==== Sniffing (Аналіз трафіку) ====
  • subjects/basic/informatika/infsecurity/technical_and_software_tools_for_information_extraction.1733074924.txt.gz
  • Востаннє змінено: 19 місяців тому
  • повз Адміністратор