shvarz

Интересное обсуждение

Хороший комментарий:

Particularly in theoretical physics, physicists used to send paper preprints to their colleagues by mail for commentary. When it began, arXiv was just a way to do this electronically in a way that obviously required far less effort on the part of the authors.
...
In high energy physics, there are essentially two types of work. Either you are involved in a massive experimental collaboration involving dozens of authors or you are a theorist. In either case, there is little chance of being scooped. If you are an experimentalist, chances are that your experiment is the only one of its type in the world because the equipment costs millions if not billions of dollars.
...
Although this is my main theory, I think there are other effects going on as well. For example, in medicine, peer review is seen as much more of a gold standard of correctness than it is in physics. Many doctors that I have spoken to (and I have spoken to many because I have a chronic illness) feel that it is unethical to release results prior to peer review because members of the public may take the results out of context and start treating themselves in a dangerous way.

И раз уж мы о доступе: Статья с анализом запросов на доступ к данным в базе данных dbGaP

Есть такая (несколько странная) позиция, что необработанные данные выкладывать не имеет смысла, потому что они все равно никому не нужны. В статье проанализировали 97 выложенных наборов данных и нашли, что за два года 70 из них были запрошены хотя бы один раз, а за три года - 96. Общее количество запросов за два года было 2724, но цифра эта явно завышена, потому что если сотрудничество ученых из 15 университетов делало запрос, то это считалось, как 15 разных запросов (и посчитать реальное количество запросов было невозможно). В статье еще много разных процентов и цифирек, но упомянутая проблема с переоценкой заставляет относиться к ним секптически. Но все равно интересно - подавляющее большинство запросов было от академии, но исследователи из фармы-биотеха в среднем запрашивали больше наборов данных. Целью большинства запросов был поиск новых закономерностей в результатах, на втором и третьем местах - разработка новых методов и проверка уже опубликованных результатов.

СОПУ и ПИПУ забороли, осталась еще *ОПА под названием HR 3699 - законопроект в конгрессе, запрещающий NIH (и другим федеральным исследовательским агенствам) устанавливать правила относительно научных публикаций. Сейчас NIH требует, чтобы результаты исследований, сделанных частично или полностью на деньги NIH, были опубликованы в журналах, предоставляющих открытый доступ к статьям не позже, чем через 12 месяцев после публикации. Это правило было компромиссом между требованием сделать общественными результаты исследований, проводящихся на общественные деньги, и нежеланием загубить давно сложившуюся частную индустрию научных журналов. Журналы имеют 12 месяцев на то, чтобы заработать на публикации статей, общество имеет пусть и запоздалый, но доступ к результатам исследований. Сейчас издательства (преимущественно исчадье ада - Elsevier :) пытаются законодательно это правило завернуть и "вернуть все как было".
Подробнее и ссылки: http://e-patients.net/archives/2012/01/open-knowledge-saves-lives-oppose-h-r-3699.html

Собственно, началось все с чего: В прошлом году я дал лекцию о ВИЧ в одной местной школе и после нее ко мне напросился волонтером Аскар, студент из этой школы. Почти год прошел с того времени и за это время его работа превратилась в статью, которая вчера вышла (pdf).

Об открытом доступе сейчас много говорят и журналы PLoS предподносят как свидетельство успеха этого движения. Мы решили проверить на практике, насколько оно действительно успешно. Я дал Аскару задание - посмотреть какой процент публикуемых статей в нашей области находится в открытом доступе. Мы случайным образом выбрали два набора статей. В первый вошли 50 самых последних статей на тему "ВИЧ вакцины". Для второго мы случайным образом выбрали 20 статей из первого списка и из каждой статьи взяли 10 случайных статей, на которые были даны ссылки (получилось 200 более старых статей).

Результат выглядел вот так:

Из "недавних" статей всего 10 были в открытом доступе (20%). Из более старых, "процитированных", статей - 2/3 были в открытом доступе.

После этого мы посмотрели на то, каков доступ к "закрытым" статьям в разных институтах - у каждого института ведь своя подписка на журналы. ( Получилось следующее )

А вот в продолжение темы открытого доступа вопрос к занимающимся наукой (математиков, физиков и программистов просим не беспокоиться - мы знаем, что у вас есть arXiv):

Вы в курсе, что большинство журналов (с доступом по подписке) разрешают вам выложить свою статью в открытый доступ сразу после публикации или даже раньше?
(вот здесь можно быстро проверить, разрешает конкретный журнал или нет - смотрите на описание для post-script)

Интересная заметка и интервью с Робертом Кили из Wellcome Trust: http://poynder.blogspot.com/2011/08/open-access-interviews-wellcome-trusts.html
Видя коммерческий успех PLoS ONE (который не только окупается, но еще и все остальные журналы серии PLoS кормит), коммерческие журналы бросились открывать свои собственные варианты упрощенных публикаций. И многие сейчас предлагают авторам заплатить за то, чтобы их статья в обычном, за подписку, журнале была в открытом доступе. Журналы понаглее и покруче, вроде Nature, просят 3-4 тысячи долларов за статью, кто попроще - согласны на 2-3 тысячи. Идея о том, что рынок и конкуренция постепенно эти цены снизят, пока не сбывается. Потому как деньги не свои и не большие, а репутация своя и дорогая - за публикацию в Nature многие душу продадут, не то что лишнюю тысячу из гранта заплатят.

И интересная статистика от Wellcome Trust. Они некоторое время назад ввел правило, согласно которому ученые, получающие от них деньги, обязаны либо публиковаться в журналах с открытым доступом, либо выкладывать свои статьи в открытый доступ на серверах типа arXiv. Wellcome это дело взялса оплачивать. Так вот, в среднем они заплатили за публикацию $2400 за статью и потратили на это в прошлом году 5 миллионов долларов, то есть в журналах с открытым доступом было опубликовано порядка 2000 статей. Если бы все получатели их грантов публиковались таким образом, то им бы пришлось заплатить 12 миллионов, что составило бы 1.25% от всех денег, что они выдают на исследования. Реально, конечно, было бы меньше 1%, потому что редко кто получает деньги только от Wellcome Trust, большинство финансируются и из других источников и WT ожидает, что эти другие источники тоже будут платить за публикации.

К слову о Plural of data is not knowledge и о доступе к данным:
Новое поколение секвинирующих технологий позволяет очень быстро и аккуратно читать ДНК последовательности. Правда технологии эти таковы, что их "сырые данные" представляют из себя огромные массивы коротких "считываний", которые потом нужно "собирать" в цельные последовательности. Из одного эксперимента получаются десятки гигабайт этих "сырых данных". NCBI открыл архив SRA, чтобы предоставить ученым возможность выкладывать эти данные в свободный доступ, дабы любой мог их самостоятельно проанализировать и прийти к выводу о качестве работы, а может и что-то новое по ним сделать.
И вот теперь RSA закрывается (а вместе с ним и Peptidome, плюс Conserved Domains Database будет уменьшена в объеме).

Похоже что у архива в принципе были проблемы и работал он не очень хорошо. Но основыми причинами для закрытия называют недостаток денег. Конечно, у NIH сейчас тяжелые времена, а с приходом к власти республиканцев/чайников они может станут еще и хуже. Тем не менее, SRA скорее всего вернется в каком-то новом перевоплощении. Но вообще в ближайшее время проблема хранения данных будет становиться все более серьезной. Не говоря уж об анализе.

Кстати, о коротких "считываниях" - это для генетиков они являются "сырыми" данными. Генетики обычно имеют дело с одной большой последовательностью (геномом), которую нужно "собрать" из кусочков. Конечная последовательность для них важна в первую очередь, а "считывания" действительно после сборки становятся мало кому интересны. Но для людей, работающих с РНК-вирусами, "считывания" в гораздо большей степени являются "конечными" данными. Потому что у РНК вирусов нет одной конкретной последовательности - их популяции состоят из близкородственных, но разных последовательностей. Поэтому сами "считывания" и их относительная частота несут в себе полезную информацию о составе популяции. Например, может быть так, что для одного конкретного нуклеотида в геноме 95% вирусов имеют G, 4% имеют A, 0.8% имеют T, и 0.2% имеют C. И именно эти 0.2% важны для эксепримента, потому что они имеют устойчивость к лекарству или способны ускользнуть от иммунного ответа.

Интересный парадокс (ну, если не парадокс, то противоречие) обнаруживается, когда говоришь с учеными о предоставлении открытого доступа к данным. С одной стороны, они не доверяют данным из других лабораторий и не особенно жаждут в них копаться. С другой стороны, они считают свои собственные данные необычайно ценными и уверены, что стоит их выложить, как все тут же кинутся в них копаться.

P.S: У меня во френдах есть практикующие ученые: Вы согласились бы выкладывать свои сырые необработанные данные в открытый доступ? Не сразу, конечно, а допустим через год после их получения. Предполагается, что для этого есть специальные программы и базы данных и у вас не уйдет на это много времени и сил. Стали бы вы анализировать данные из других лабораторий?

Какую я классную штуку нашел: https://app.nihmaps.org/nih/browser/ !!! (сверху надо нажать на Map Viewer)
Все гранты NIH расположены по родственности (отслеженной по ключевым словам, названиям, тексту). Каждая точка - отдельный грант, про который можно почитать на что он дан и кому. Интерфейс довольно дурацкий, показывать выборочно данные невозможно, подписей на группах грантов мало, но можно зумать и выделять отдельные гранты или группы. Можно также просить показать какие гранты спонсируются какими институтами.

На The Scientist вышла статья о том, почему испытанные на животных моделях лекарства оказываются неэффективными в людях. Статья несколько сумбурная, и фокусирующаяся в основном на технических недостатках работ, сделанных на модельных животных. Но она мне напомнила о прекрасной статье на эту же тему, вышедшей года полтора назад.
"A prescription for Human Immunology" by Mark Davis (pdf в свободном доступе)
Если вы ее не читали, и интересуетесь биологией и медиционой то очень советую - Марк пишет прекрасно, читать его одно удовольствие, статья недлинная и почти без научного жаргона.

Так вот, в первой части этой статьи Марк рассуждает следующим образом:
За последние два десятилетия иммунология проделала гигантский прогресс в нашем понимании иммунной системы, однако практически ничего не привнесла в медицину. Все прекрасно осведомлены о важности иммунной системы и о том, что многие болезни завязаны на иммунную систему, но почему то применение нашего знания к решению конкретных проблем движется очень медленно. Дэвис большую часть вины за этот недостаток прогресса складывает на мышиные модели.
Дело в том, что в мышах сейчас можно сделать с иммунной системой практически все, что угодно - поменять, удалить или добавить любые гены, измерить количество любых клеток и их функциональность, вызвать нужную болезнь в определенном возрасте и т.д. и т.п. И чем больше мы узнаем о мышах и об их иммунной системе, тем большего мы можем там достичь. Исследования человеческой иммунной системы, на фоне мышиной иммунологии, выглядят довольно жалко. В результате вся иммунология перекошена в сторону исследования мышей. И хотя мыши отлично подходят для получения фундаментальных знаний об иммунологии, они очень плохо подходят для моделирования человеческих болезней и действия лекарств. Марк приводит следующие проблемы с мышиными моделями:

лабораторные мышиные линии высоко-инбредны и давно существуют в неестественных условиях. В них много разных мутаций, которые закрепились в них случайно и придают их иммунным системам неестественную функциональность.

хотя в мышах можно вызвать почти любую человеческую болезнь (с идентичными симптомами), зачастую подлежащие причины этой болезни отличаются от причин соответствующих человеческих болезней

эволюционно, мыши находятся далеко от нас - они отделились примерно 65 миллионов лет назад

иммунная система короткоживущего грызуна, проводящего большую часть времени под землей, оптимизирована на совсем иные функции, чем наша иммунная система.

Как Марк предлагает решить эту проблему? Он предлагает сделать человека "моделью". Новые методики исследований позволяют собирать огромное количество информации используя очень маленькие объемы образцов, ради которых не приходится потрошить исследуемый организм на запчасти. Следует заняться этим систематически, собирая образцы у большого количества здоровых и больных людей. Кроме того, в нашем распоряжении существуют ежедневно-проходящие иммунологические "эксперименты" в виде массовых вакцинаций, в которых иммунные системы большого количества людей реагируют на хорошо-исследованные и одинаковые антигены - это просто кладезь информации. Если получаемая информация будет выкладываться в базы данных с открытым доступом, то это создаст мощнейший инструмент для продвижения человеческой иммунологии, подобно тому как Human Genome Project революционизировал исследования генетики человека.

Библиотеки UC (Университет Калифорнии) угрожают начать призывать профессоров бойкотировать журналы, издаваемые Nature Publishing Group
- не посылать туда статьи
- не рецензировать их статьи
- уйти из редакционных комиссий этих журналов
- не покупать рекламные места
- поднимать бучу по поводу ценовой политики NPG

Все это в ответ на желание NPG поднять цену на свои журналы в 4 раза в следующем году.
(via

tea_with_milk)

Update: Ответ Nature
Update 2: Ответ UC на ответ Nature

Читаю сейчас один отчет, который заставил меня вспомнить о дискуссиях по поводу разразившегося несколько месяцев назад климат-гейта, и задуматься о том, как именно хранятся научные данные, насколько открыт к ним доступ для широкой публики, и насколько широко распространяются обязательства ученых по предоставлению информации, необходимой для воспроизведения их экспериментов. В теории, конечно, ответ довольно прост: при публикации ученый обязан подробно описать все методы, необходимые для воспроизведения его работы, а после публикации, обязан предоставить реактивы и-или необработанные данные всем желающим. На практике, на самом деле, все бывает намного сложнее и запутаннее.
( довольно длинно, для тех, кому эта тема интересна )
Интересно, что когда я приводил эти примеры в дискуссиях о климат-гейте, чтобы проиллюстрировать то, что идеальная картина организации науки далеко не всегда соответствует практике, то меня сразу же зачисляли в ряды таких же "ученых" (sic, в кавычках!) или воспринимали их как подтверждение того, что наука сейчас вообще неизвестно куда катится и состоит лишь сплошь из прохиндеев и жуликов.

Гугль цифровал книги. Издатели и авторы подали в суд и вроде как полюбовно с Гуглем договорились о чем-то (о чем, я не понял). Теперь Микрософт, Амазон, Яху и многие другие обеспокоились этой сделкой и организовали Open Book Aliance. Мне кажется, основное их беспокойство связано с тем, что их обделяют куском толстого и вкусного пирога, но по-крайней мере на словах они борются за то, чтобы оцифрованные книги были в открытом доступе.

Все на английском:
Интересная статья о конкуренции между традиционными СМИ и блогами: http://michaelnielsen.org/blog/?p=629
Интересный комментарий об этой статье: http://johnhawks.net/weblog/topics/metascience/open-access/science-publishing-nielsen-2009.html

А тут не о науке, а о политике, но конфликт очень похож: http://www.realclearpolitics.com/video/2009/06/29/dana_milbank_huffpost_reporter_spar_over_question_at_presser.html

Украинским френдам (я знаю у меня есть такие): Для вас существует ресурс, который дает вам бесплатный доступ к целому ряду научных журналов (включая Science):
http://highwire.stanford.edu/lists/devecon.dtl
Не надо ни регистрироваться ни устанавливать специальные программы, вас там определяют по IP адресу.
Это, кстати, относится и к таким странам, как Армения, Грузия, Азербайджан и Туркменистан (но оттуда у меня френдов, кажется, нет).

У ученых часто спрашивают, что именно они делают в своих лабораториях, кроме сидения в креслах с умным видом.
Вот замечательный журнал, публикующий видеопротоколы разных экспериментов: JOVE
Там можно сделать поиск по интересующей теме и посмотреть короткие ролики. Например, вот до боли родной мне протокол получения вирусов: http://www.jove.com/index/details.stp?ID=550
А вот тут изучают мозги мертвых шизофреников: http://www.jove.com/index/details.stp?ID=717
Сразу предупрежу, что довольно скучные фильмы - ничего там не взрывается и радиоактивные мутанты за лаборантами не гоняются. Все больше пробирки, пипетки, гели...
Хотя вот это выглядит довольно мрачно: http://www.jove.com/index/details.stp?ID=678

Now, as indicated by their support for the Fair Copyright in Research Works Act, publishers are taking a stand against archiving.
...
the real battle for the future of science is not about NIH's provision of delayed access to author's drafts. It is about efforts to protect unsustainable revenue streams

а, как следствие, и науки в целом: Интересная статья (via

demographer)

Когда речь идет о свободном доступе, то в первую очередь думают о преимуществах для читателей. Однако преимущества есть и для авторов. А именно - существенное (в 2-3 раза) увеличение цитирования статьи.
В 2001 году Lawrence посчитал, что в computer science статьи выложенные в свободном доступе on-line цитируются в 2.5 раза чаще, чем статьи доступные лишь в печати.
В 2005 году Hajjem et al. сделали похожий анализ в целом ряде дисциплин (включая биологию, экономику, политику) и нашли сходные цифры - свободно доступные статьи цитировались в 1.5-2.5 раза чаще статей доступных только по подписке, даже если эти статьи были опубликованы в одном и том же журнале.
В 2006 году Eysenbach сделал подобный анализ для статей, опубликованных в PNAS в 2004-2005 годах, и тоже нашел, что свободно доступные статьи цитировались в 2-3 раза чаще.

Возможно эти цифры частично объясняют тот факт, что относительно новые журналы серии PLoS имеют impact factors сравнимые с очень авторитетными журналами в своей области.

Я об этом собираюсь еще довольно много писать, поэтому решил сделать небольшое введение для тех, кто не знает что это такое, зачем все это нужно, и в чем вообще тут дело.
В самых общих словах, движение за свободный доступ выступает за то, чтобы вся имеющаяся на данный момент научная информация была доступна всем людям на Земле (на практике - всем, имеющим интернет). На эту информацию не должен распространяться никакой копирайт, ограничивающий ее возможное использование. Единственное требование - корректное указание авторства.
Подчеркну, что речь в данном случае идет именно о научной инфомации, а не книгах, музыке, софте, фильмах и т.д. И даже более конкретно - о конечном результате научной деятельности, научных статьях. Свободный доступ к данным конкретных экспериментов тоже будет обсуждаться, но там все несколько более запутанно и сложно. Пока что просто о статьях, то есть об основном товаре научной индустрии.
Вкратце о том, как обстояли дела до недавнего времени. Система работала так: Правительство давало деньги ученым, те делали открытия и писали статьи, которые публиковались в бумажных журналах. Для того, чтобы читать эти статьи, нужно было платить за подписку на журнал. Ситуация, на самом деле, была довольно странная - деньги дают одни, работу делают другие, а контролируют результаты этой работы - третьи. И контролируют очень жестко - когда журналы брали эти статьи для публикации, они требовали с ученых подписку о передаче издательствам всех прав на эти статьи. Я еще помню те времена, когда в библиотеке не разрешалось делать ксерокопии со статей, потому что это нарушало копирайт журналов. Если вам нужна была некая статья, то нужно было либо платить некую сумму, либо писать автору статьи письмо с просьбой прислать копию. Авторы при этом сами покупали (во время публикации) дополнительные копии своей статьи, которые они потом и рассылали в ответ на такие запросы.
Система была настолько дурацкая, что удивительно то, что она вообще так долго просуществовала. Интернет, ксерокс и общее недовольство ограниченностью доступа к нужной информации в последние 10-15 лет начали расшатывать этот карточный домик. Сообщество ученых стало осозновать, что доступ к информации является абсолютной необходимостью в научной работе и потому не стоит отдавать его в руки коммерческих компаний. Движение за свободный доступ пытается построить новую систему, в которой информация могла бы распространяться неограниченно и почти бесплатно. Для этого требуется создание новой бизнес-модели, которая позволила бы оплачивать этот доступ, а также решить целую массу проблем связанных с копирайтами, авторскими правами и прочими легальными закорючками.

Profile

shvarz

DarwinBots

December 2013

S	M	T	W	T	F	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Syndicate

Page Summary

Style Credit

Style: Neutral Good for Practicality by timeasmymeasure

Expand Cut Tags

No cut tags

Page generated Aug. 3rd, 2025 01:38 pm

Entries tagged with open access

Почему расцвел arXiv

Доступ к данным

HR3699

Статья про доступ к статьям

Дорога из зеленого кирпича

Журналы в накладе не остаются

NCBI закрывает SRA

Доступ к данным

Карта грантов NIH

Модельный организм

Бойкот "Nature"

Научный подход: Данные и Методы

Оцифровывание книг

Traditional media vs. blogs

Доступ к научным журналам

Работа в лабе

Empire strikes back

О состояние российских медико-биологических журналов

Преимущества свободного доступа

Что такое свободный доступ