shvarz: (Default)
shvarz ([personal profile] shvarz) wrote2010-10-26 04:37 pm
Entry tags:

Доступ к данным

Интересный парадокс (ну, если не парадокс, то противоречие) обнаруживается, когда говоришь с учеными о предоставлении открытого доступа к данным. С одной стороны, они не доверяют данным из других лабораторий и не особенно жаждут в них копаться. С другой стороны, они считают свои собственные данные необычайно ценными и уверены, что стоит их выложить, как все тут же кинутся в них копаться.

P.S: У меня во френдах есть практикующие ученые: Вы согласились бы выкладывать свои сырые необработанные данные в открытый доступ? Не сразу, конечно, а допустим через год после их получения. Предполагается, что для этого есть специальные программы и базы данных и у вас не уйдет на это много времени и сил. Стали бы вы анализировать данные из других лабораторий?

[identity profile] san-diegan.livejournal.com 2010-10-26 09:48 pm (UTC)(link)
Космохимия. Исследования хронологии ранней Солнечной системы методами высокоточной масс-спектрометрии с использованием коротко- и дологоживущих радинуклидов.
Таблицы не то что бы особенно ценны, они в абстракты просто не влезают)), не тот формат. Абстракты вообще для другого, не для деталей.
Что до сырых данных, то мне остаётся непонятным, зачем их отдавать кому-то на анализ. Проанализируют, сделают выводы, опубликуют. А зачем я тогда в лаборатории месяцами сидел? Я же после этого те же данные не смогу опубликовать. А без публикаций и грантов не дадут. И вообще обидно )). Нет, пусть вначале я опубликую результаты, достаточно "причёсанные" а потом уже пусть другие анализируют как хотят, сравнивают со своими данными, подтверждают или не подтверждают.

[identity profile] shvarz.livejournal.com 2010-10-27 12:17 am (UTC)(link)
Что до сырых данных, то мне остаётся непонятным, зачем их отдавать кому-то на анализ. Проанализируют, сделают выводы, опубликуют. А зачем я тогда в лаборатории месяцами сидел?
Ну я же вроде ответил выше - кто-то может найти в ваших данных то, чего вы сами найти не смогли. Это как один пример.

Я же после этого те же данные не смогу опубликовать.
Обычно в таких ситуациях есть эмбарго на год, чтобы производитель данных мог первым опубликоваться.

И опять же возвращаясь к начальному посылу: Если кто-то в вашей области выложит свои неопубликованные еще данные в открытий доступ, то будете ли вы их анализировать и публиковать до того, как он их проанализирует и опубликует?

[identity profile] san-diegan.livejournal.com 2010-10-27 01:25 am (UTC)(link)
Егор,
1. Убейте меня, не могу понять. Почему до, а не после? Наверное, я тупой. Естественно, делишься с коллегами мыслями, данными, совета спрашиваешь часто, но вываливать сырые экспериментальные данные на всеобщее обозрение...В своих экспериментальных данных я должен быть уверен сначала сам. На том и стоим.
2. Я не знаком с правила эмбарго. Повторю, у вас может быть специфика, мне неизвестная.
3. Первое и не задумываясь, конечно, не буду. Публиковать, то есть. Посмотреть могу. С личного разрешения. И вообще, это звучит, я не вор ли ты, Саша?)) А в открытый доступ никто не ставит. Хуже другое, и опубликованные данные некоторая молодёжь не всегда и читает, поэтому, например, не так давно пришла мне статья на рецензию из очень хорошего журнала, которая описывает новый, по мнению автора, метод, котрый мы двенадцать лет назад предложили. Не думаю, что ворует. Не читает.

[identity profile] shvarz.livejournal.com 2010-10-27 03:30 pm (UTC)(link)
1. Да нет, вовсе не обязательно "до". Сразу "после" тоже можно. Но ведь народ готов сидеть на данных годами. И я не говорю про сырые данные, я говорю про необработанные (понятие обработки, конечно, зависит от каждого конкретного вида данных). Другие люди мыслят очень иначе чем вы и могут в них найти что-то интересное, до чего вы бы никогда не додумались. С моими результатами (данные я не выкладывал) такое было однажды - теоретики написали очень интересную интерпретацию результатов, до которой я сам бы никогда не дошел. Знал бы я, что кому-то они были интересны, я бы и необработанные данные выложил. Что мне, жалко что-ли?
2. Например: В базах данных бывает такое правило, что если ты делаешь метаанализ по всем содержащимся в ней данным, то нужно исключать все данные, полученные не тобой за последний год. Это дает преимущество получившим данные, они могут сделать такой метаанализ вперед других используя свои данные. Статьи, основанные исключительно на анализе чужих данных тоже не печатаются первый год, по той же причине. При этом анализ ты можешь делать, что позволяет науке двигаться вперед быстрей.
3. Почему вор? Вор это если залез без разрешения. Если человек выложил в открытый доступ и есть общепринятые правила того, как этим выложенным можно пользоваться, то какое-же тут воровство?

[identity profile] san-diegan.livejournal.com 2010-10-28 01:08 am (UTC)(link)
Спасибо. Вроде договорились и поняли.