Skip to content

SlinkoIgor/data_mining_course2

Repository files navigation

data_mining_course2

Better version of data_mining_course

Программа курса:

  1. Мотивация, зачем использовать Python для анализа данных. Типы данных в Питоне (int, float, bool, NoneType). Контейнеры (list, tuple, str, dict)
  2. Операторы условий if, else. Циклы for, while. Контейнер dict.
  3. Работа со строками. Работа с файлами.
  4. Создание функций и классов. Итераторы и генераторы.
  5. Библиотеки collections, math. Обработка исключений.
  6. Библиотека requests. Работа с структурированными данными (JSON). Парсим Instagram.
  7. Библиотека pandas: Объекты Series и DataFrame. Чтение-запись данных в различных форматах. Запросы к таблицам: выборка строк/столбцов по заданным критериям. Модификация элементов таблицы. Добавление строк/столбцов.
  8. Визуализация. Обзор библиотек: matplotlib, seaborn. Базовые типы визуализаций: графики, столбчатые диаграммы, гистограммы, точечные диаграммы (scatter plots), ящики с усами. Работа с структурированными данными (XML)
  9. Парсинг сайтов на примере Wikipedia. Библиотека BeautifulSoup.
  10. Работа с API (Yandex SpeechKit, VK API)
  11. Парсинг динамических сайтов. Библиотека Selenium. Машинное обучение с помощью библиотеки CatBoost

About

Better version of data_mining_course

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published