Общедоступные источники бесплатных наборов данных

Откуда бесплатно брать данные?

Вечный вопрос для начинающих и профессиональных исследователей Big Data. Поэтому я решила собирать подборку ресурсов, которые использую сама и рекомендую своим клиентам и студентам.

(Буду рада Вашим дополнениям. Пожалуйста, присылайте их мне на почту)

    1.  Google DataSets и Google Cloud Public Dataset Program
    2. Google DataSets Search – это инструмент, с помощью которого пользователи могут находить информацию в тысячах хранилищ по всему Интернету, используя простые ключевые слова
    3. Kaggle DataSets
    4. Amazon Web Services Public DataSets
    5. OpenData.University (бесплатный парсинг из Вконтакте, но только для образовательных целей)
    6. UCI Machine Learning Repository
    7. Academic Torrents
    8. Quandl — репозиторий данных по экономике и финансам
    9. Harvard Dataverse
    10. DoltHub
    11. Data Is Plural
    12. Рекомендуемые репозитории от журнала Nature по разных научным областям
    13. Find Datasets | CMU Libraries. Коллекция датасетов, предоставленная университетом Карнеги Меллон.
    14. AirBnB data
    15. Dataset Library for Machine Learning
    16. Российские хранилища наборов открытых данных
    17. Хаб открытых данных
    18. Датасеты для машинного обучения и анализа данных

И отдельное спасибо конференции «День открытых данных» (6-7 марта в Москве)

Конференция прошла 6-7 марта 2020 года в Москве. Именно там я получила кладезь ценных источников открытых данных по разным сферам. Так что делюсь! Возможно, эта информация окажется полезной и для Ваших анализов и данных для алгоритмов искусственного интеллекта.