shvarz: (Default)
shvarz ([personal profile] shvarz) wrote2010-10-26 04:37 pm
Entry tags:

Доступ к данным

Интересный парадокс (ну, если не парадокс, то противоречие) обнаруживается, когда говоришь с учеными о предоставлении открытого доступа к данным. С одной стороны, они не доверяют данным из других лабораторий и не особенно жаждут в них копаться. С другой стороны, они считают свои собственные данные необычайно ценными и уверены, что стоит их выложить, как все тут же кинутся в них копаться.

P.S: У меня во френдах есть практикующие ученые: Вы согласились бы выкладывать свои сырые необработанные данные в открытый доступ? Не сразу, конечно, а допустим через год после их получения. Предполагается, что для этого есть специальные программы и базы данных и у вас не уйдет на это много времени и сил. Стали бы вы анализировать данные из других лабораторий?

Re: потому что боится, что его обкрадут

[identity profile] vasja-iz-aa.livejournal.com 2010-11-01 12:11 am (UTC)(link)
Ринулось огромное количество людей, к науке весьма причастных -- физиков, математиков и даже биологов.

Письма были лишь эпизодом длительного процесса по извлечению из климатологов данных и кода программ.

Попробуйте посмотреть на вопрос немного с другой стороны. А зачем вообще нужно класть в базу сами данные? Вполне достаточно поместить туда информацию, что у исследователя Иванова такие данные есть и он готов ими делиться, безвозмезно или на каких то условиях. Тогда тот ученый Петров, которому данные нужны, он напишет емайл Иванову и получит их в той форме и с теми сопроводительными комментариями, которые ему хочется и которые именно для его варианта использования данных важны. А может быть Иванов йти данные на своей персональной вебстраничке будет держать, для автоматического скачивания. Чем такой вариант, хуже? Ну, кроме того, что биоинформатик Сидоров без зарплаты остался.

Re: потому что боится, что его обкрадут

[identity profile] shvarz.livejournal.com 2010-11-03 06:12 pm (UTC)(link)
Иванов ответит первым трем запрашивающим, остальных пошлет нафиг, потому что ему надоест. Вот пример: http://shvarz.livejournal.com/257253.html?thread=3996133#t3996133

Или окажется, что данные Иванов хранил на 5-дюймовых дискетах и сейчас уже не найти дисковода, чтобы их считать.

Или окажется, что данные аннотированы настолько скудно, что разобраться в них мог лишь постдок Смирнов, который их получил, и который сейчас бросил науку и ушел на Уолл-стрит.

Или окажется, что Иванов сам бросил лабу и ушел на пенсию.

Да много еще можно придумать сценариев, когда "данные на страничке" вовсе не равны данным в базе данных.

Re: потому что боится, что его обкрадут

[identity profile] vasja-iz-aa.livejournal.com 2010-11-04 05:22 am (UTC)(link)
Первым Иванов пошлет биоинформатика, который захочет забрать его данные к себе в базу. Примеров полно, в том числе и в этот треде. А уж потом , во-вторых, Иванов ответит не первым трем, а лучшим трем, чем сушественно увеличит качество обращающихся данных и избавит нас от изрядной доли спама. Сам. Бесплатно.

Во времена 5-дюймовых дискет экспрессионные профили получали на стеклянных пластинках со ста точками на каждой, и в наши дни эти сырые данные в совершенно равной степени нужны научному сообществу в общедоступной базе, на 5-дюймовых дискетах и в мусорной корзине.

и так далее.

А в преимуществах мы выигрываем в адресности предоставлямой информации и в отсутствии потерь на то, что нужная часть описания потерялась из-за издержек стандартизации.