среда, 6 февраля 2019 г.

Большие научные базы данных

Где взять большие данные, вопрошают те, кто хочет заняться модным направлением Big Data. Банки и сотовые операторы не отдадут ведь накопленную информацию, это ж понятно. Эххх :(
Но почему б не заняться аналитикой научных данных? Ученые - люди добрые, массу всего интересного в открытый доступ выкладывают. 

Вот, например, Protein Data Bank (PDB). Содержит массу информации о структуре всяких белков. Насколько я знаю, там в районе 40 ГБ данных. Поиск по PDB можно делать на этой страничке.  Там в основном файлы в формате .cif. Информация о работе с этим форматом есть на mmcif.wwpdb.org

А еще есть Crystallography open database. Располагается здесь. Думаю, там не меньше данных собрано.


Комментариев нет: