смирнов про ящериц
Jan. 30th, 2017 03:47 pmИнтересное интервью Смирнова Гельфанду: http://trv-science.ru/2017/01/17/stanislav-smirnov-mathwalks/. Среди прочего, Смирнов говорит: "Последняя статья, которую я написал с коллегами, как раз по биологии. Мы изучаем раскраску конкретного семейства ящериц и показываем, что уравнения реакции-диффузии Тьюринга, связывающие концентрации хроматофоров, при переменных коэффициентах..." (тут Гельфанд его перебивает). Попытался найти эту статью и не могу; в архиве нет, в google scholar нет, на женевском сайте Смирнова нет, на сайте лаборатории Чебышева тоже нет. Может быть, статья еще не написана? Судя по разговору, непохоже: Гельфанд там хмыкает, мол, это простая математика и простая биология, а Смирнов ему на это -- ты не торопись, лучше почитай. Никто не знает, о чем речь?
Еще Смирнов рассказывает про (в ML хорошо известные) recommender systems для нетфликсовского конкурса на базе SVD with missing data и говорит, что это "похоже на биологические вещи". Это спорно, и Гельфанд сразу начинает спорить; но может быть, и правда похоже. Я вот как раз с нового года настраиваю что-то подобное для single cell RNA sequencing: технология фантастическая, но глубина секвенирования (пока?) не очень и существенный процент генов не детектируется, т.е. их уровень экспрессии измерен как нулевой, хотя на самом деле это missing value.
Еще Смирнов рассказывает про (в ML хорошо известные) recommender systems для нетфликсовского конкурса на базе SVD with missing data и говорит, что это "похоже на биологические вещи". Это спорно, и Гельфанд сразу начинает спорить; но может быть, и правда похоже. Я вот как раз с нового года настраиваю что-то подобное для single cell RNA sequencing: технология фантастическая, но глубина секвенирования (пока?) не очень и существенный процент генов не детектируется, т.е. их уровень экспрессии измерен как нулевой, хотя на самом деле это missing value.
no subject
Date: 2017-01-30 07:09 pm (UTC)no subject
Date: 2017-01-30 10:17 pm (UTC)Ну или т.н. patch-seq (http://www.nature.com/nbt/journal/v34/n2/abs/nbt.3445.html и http://www.nature.com/nbt/journal/v34/n2/abs/nbt.3443.html). Это совсем новые работы: сначала делают patch-clamp, записывают электрофизиологию, а потом прямо через ту же пипетку высасывают содержимое клетки и секвенируют РНК. Это, конечно, не high-throughput, а ручная работа, так что на выходе пока получается 100-200 клеток, но сочетание электрофизиологии и секвенирования впечатляет.
no subject
Date: 2017-02-05 01:58 pm (UTC)no subject
Date: 2017-02-07 02:36 pm (UTC)no subject
Date: 2017-02-07 07:26 pm (UTC)no subject
Date: 2017-02-08 12:49 am (UTC)no subject
Date: 2017-02-08 02:15 am (UTC)no subject
Date: 2017-02-10 04:31 pm (UTC)Почему на качественном?
Date: 2017-02-10 07:35 pm (UTC)95% of non-zero gene-counts in the filtered matrix had a value less than or equal to 3 (75% 1’s, 16% 20s and 4% 30s), suggesting that
our data (given the shallow sequencing depth) primarily reflected presence/absence of transcripts and did not capture the full dynamic
range for most transcripts (Figure S1C).
no subject
Date: 2017-02-15 03:45 pm (UTC)no subject
Date: 2017-02-15 05:35 pm (UTC)миллион все равно очень мало, при лобовом подходе на RNASeq надо 10-30 миллионов. в этом одна из основных проблем метода: в общем потоке секвинируется куча хорошо представленой но малоинтересной РНК,которая отжирает reads у важных и интересных исследователю генов