Entry tags:
Доступ к данным
Интересный парадокс (ну, если не парадокс, то противоречие) обнаруживается, когда говоришь с учеными о предоставлении открытого доступа к данным. С одной стороны, они не доверяют данным из других лабораторий и не особенно жаждут в них копаться. С другой стороны, они считают свои собственные данные необычайно ценными и уверены, что стоит их выложить, как все тут же кинутся в них копаться.
P.S: У меня во френдах есть практикующие ученые: Вы согласились бы выкладывать свои сырые необработанные данные в открытый доступ? Не сразу, конечно, а допустим через год после их получения. Предполагается, что для этого есть специальные программы и базы данных и у вас не уйдет на это много времени и сил. Стали бы вы анализировать данные из других лабораторий?
P.S: У меня во френдах есть практикующие ученые: Вы согласились бы выкладывать свои сырые необработанные данные в открытый доступ? Не сразу, конечно, а допустим через год после их получения. Предполагается, что для этого есть специальные программы и базы данных и у вас не уйдет на это много времени и сил. Стали бы вы анализировать данные из других лабораторий?
Re: потому что боится, что его обкрадут
Письма были лишь эпизодом длительного процесса по извлечению из климатологов данных и кода программ.
Попробуйте посмотреть на вопрос немного с другой стороны. А зачем вообще нужно класть в базу сами данные? Вполне достаточно поместить туда информацию, что у исследователя Иванова такие данные есть и он готов ими делиться, безвозмезно или на каких то условиях. Тогда тот ученый Петров, которому данные нужны, он напишет емайл Иванову и получит их в той форме и с теми сопроводительными комментариями, которые ему хочется и которые именно для его варианта использования данных важны. А может быть Иванов йти данные на своей персональной вебстраничке будет держать, для автоматического скачивания. Чем такой вариант, хуже? Ну, кроме того, что биоинформатик Сидоров без зарплаты остался.
Re: потому что боится, что его обкрадут
Или окажется, что данные Иванов хранил на 5-дюймовых дискетах и сейчас уже не найти дисковода, чтобы их считать.
Или окажется, что данные аннотированы настолько скудно, что разобраться в них мог лишь постдок Смирнов, который их получил, и который сейчас бросил науку и ушел на Уолл-стрит.
Или окажется, что Иванов сам бросил лабу и ушел на пенсию.
Да много еще можно придумать сценариев, когда "данные на страничке" вовсе не равны данным в базе данных.
Re: потому что боится, что его обкрадут
Во времена 5-дюймовых дискет экспрессионные профили получали на стеклянных пластинках со ста точками на каждой, и в наши дни эти сырые данные в совершенно равной степени нужны научному сообществу в общедоступной базе, на 5-дюймовых дискетах и в мусорной корзине.
и так далее.
А в преимуществах мы выигрываем в адресности предоставлямой информации и в отсутствии потерь на то, что нужная часть описания потерялась из-за издержек стандартизации.