Better version of data_mining_course
- Мотивация, зачем использовать Python для анализа данных. Типы данных в Питоне (int, float, bool, NoneType). Контейнеры (list, tuple, str, dict)
- Операторы условий if, else. Циклы for, while. Контейнер dict.
- Работа со строками. Работа с файлами.
- Создание функций и классов. Итераторы и генераторы.
- Библиотеки collections, math. Обработка исключений.
- Библиотека requests. Работа с структурированными данными (JSON). Парсим Instagram.
- Библиотека pandas: Объекты Series и DataFrame. Чтение-запись данных в различных форматах. Запросы к таблицам: выборка строк/столбцов по заданным критериям. Модификация элементов таблицы. Добавление строк/столбцов.
- Визуализация. Обзор библиотек: matplotlib, seaborn. Базовые типы визуализаций: графики, столбчатые диаграммы, гистограммы, точечные диаграммы (scatter plots), ящики с усами. Работа с структурированными данными (XML)
- Парсинг сайтов на примере Wikipedia. Библиотека BeautifulSoup.
- Работа с API (Yandex SpeechKit, VK API)
- Парсинг динамических сайтов. Библиотека Selenium. Машинное обучение с помощью библиотеки CatBoost