
Откуда бесплатно брать данные?
Вечный вопрос для начинающих и профессиональных исследователей Big Data. Поэтому я решила собирать подборку ресурсов, которые использую сама и рекомендую своим клиентам и студентам.
(Буду рада Вашим дополнениям. Пожалуйста, присылайте их мне на почту)
-
- Google DataSets и Google Cloud Public Dataset Program
- Google DataSets Search – это инструмент, с помощью которого пользователи могут находить информацию в тысячах хранилищ по всему Интернету, используя простые ключевые слова
- Kaggle DataSets
- Amazon Web Services Public DataSets
- OpenData.University (бесплатный парсинг из Вконтакте, но только для образовательных целей)
- UCI Machine Learning Repository
- Academic Torrents
- Quandl — репозиторий данных по экономике и финансам
- Harvard Dataverse
- DoltHub
- Data Is Plural
- Рекомендуемые репозитории от журнала Nature по разных научным областям
- Find Datasets | CMU Libraries. Коллекция датасетов, предоставленная университетом Карнеги Меллон.
- AirBnB data
- Dataset Library for Machine Learning
- Российские хранилища наборов открытых данных
- Хаб открытых данных
- Датасеты для машинного обучения и анализа данных
И отдельное спасибо конференции «День открытых данных» (6-7 марта в Москве)
Конференция прошла 6-7 марта 2020 года в Москве. Именно там я получила кладезь ценных источников открытых данных по разным сферам. Так что делюсь! Возможно, эта информация окажется полезной и для Ваших анализов и данных для алгоритмов искусственного интеллекта.