Задачи и ТуДушки

Есть уже небольшие наработочки, тут буду вести выжимку того, что успел изучить и собирать облачко информации

— Необходимо изучить книгу по глубокому обучению

https://habrahabr.ru/company/piter/blog/346358/

— Потестировать себя

— Инфа про классификацию текстов

https://opendatascience.slack.com/archives/C047H3DP4/p1520339149000451

— Для визуализации ClickHouse

https://github.com/apache/incubator-superset

— Для хранения кода

https://gogs.io/

— Фигня для прогресс бара, декоратор для итераторов

https://github.com/tqdm/tqdm

Статьи для изучения

Книги на которые стоит обратить пристальное внимание

Statistical Inference

Bayesian Infernce

Casual Inference

Python Machine Learning

Работа с библиотеками и утилитами для машинного обучения и науки о данных в Python

Перечень библиотек

NumPy

Pandas

SciPy

Dask

Scikit-Learn

Visualization: Matplotlib, Seaborn, Vega

NLP: NLTK, Gensim, Pymorphy2, Natasha

Flask, API, NGINX

PyTorch

последовательность int/float в памяти, через это оно хорошо ложится на кэш-линии при сканировании и напрямую ин

Основные вехи изучения ML

Все, что связано с линейными моделями

Методы опорных векторов (SVM)

Деревья решений

Градиентный бустинг

Общие подходы к решению задач ML

Adversarial Validation

Источники:

Курс Прикладные задачи анализа данных

Ссылки:

Нейросети и все их фишечки

Перечень архитектур нейросетей

https://habr.com/ru/company/oleg-bunin/blog/340184/

Семейство моделей HMM, CRF

Ссылки:

Заметки и ссылки

Различные алгоритмические подходы

Genetic Algorithms

Термины и сокращения

Ссылки на статьи и матералы

Спортивный анализ данных

https://habrahabr.ru/company/yandex/blog/327444/

Байесовый подход к машинному обучению

Прогнозирование временных рядов

Метрики

Информация по работе с метриками машинного обучения