kobak: (Default)
[personal profile] kobak
Интересное интервью Смирнова Гельфанду: http://trv-science.ru/2017/01/17/stanislav-smirnov-mathwalks/. Среди прочего, Смирнов говорит: "Последняя статья, которую я написал с коллегами, как раз по биологии. Мы изучаем раскраску конкретного семейства ящериц и показываем, что уравнения реакции-диффузии Тьюринга, связывающие концентрации хроматофоров, при переменных коэффициентах..." (тут Гельфанд его перебивает). Попытался найти эту статью и не могу; в архиве нет, в google scholar нет, на женевском сайте Смирнова нет, на сайте лаборатории Чебышева тоже нет. Может быть, статья еще не написана? Судя по разговору, непохоже: Гельфанд там хмыкает, мол, это простая математика и простая биология, а Смирнов ему на это -- ты не торопись, лучше почитай. Никто не знает, о чем речь?

Еще Смирнов рассказывает про (в ML хорошо известные) recommender systems для нетфликсовского конкурса на базе SVD with missing data и говорит, что это "похоже на биологические вещи". Это спорно, и Гельфанд сразу начинает спорить; но может быть, и правда похоже. Я вот как раз с нового года настраиваю что-то подобное для single cell RNA sequencing: технология фантастическая, но глубина секвенирования (пока?) не очень и существенный процент генов не детектируется, т.е. их уровень экспрессии измерен как нулевой, хотя на самом деле это missing value.

Date: 2017-01-30 03:21 pm (UTC)
From: [identity profile] flying-bear.livejournal.com
Он мне рассказывал про эту статью несколько месяцев назад, обещал прислать текст, так и не прислал. Стас, мягко говоря, занятый человек, видимо, не удалось пока дописать.

Date: 2017-01-30 04:19 pm (UTC)
From: [identity profile] kobak.livejournal.com
Понятно, спасибо! Значит будем ждать.

На другую тему: мне в этом интервью бросилось в глаза замечание Стаса, что квантовый компьютер "появится через десять лет". Даже если не разделять целиком Ваш скепсис по отношению к кв. комп., 10 лет все равно кажутся сильным преувеличением.

Date: 2017-01-30 04:39 pm (UTC)
From: [identity profile] flying-bear.livejournal.com
Мне тоже.

Date: 2017-01-30 05:30 pm (UTC)
From: [identity profile] am.livejournal.com
Там дальше речь, в частности, о Conus textile (https://en.wikipedia.org/wiki/Rule_30)
- клеточных автоматах, имеющим также
отношение, например, к L-грамматикам (https://en.wikipedia.org/wiki/L-system).
Известное направление в математической
биологии, моделировании и дизайне (https://en.wikipedia.org/wiki/Digital_morphogenesis).

Про нетфликс (http://am.livejournal.com/501012.html) и их конкурс было
немало статей на habrahabr (https://habrahabr.ru/search/?target_type=posts&order_by=relevance&q=netflix+%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5+%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5&flow=).
Я слышал где-то про использование
SVM with missing data в нетфликсе.

Date: 2017-01-30 07:09 pm (UTC)
From: [identity profile] vasja-iz-aa.livejournal.com
а Вы не могли бы чуть подробнее рассказать про single cell RNA sequencing? какая из технологий Вам показалась фантастической?

Date: 2017-01-30 08:46 pm (UTC)
From: [identity profile] kobak.livejournal.com
Да, про одномерный клеточный автомат в ракушках -- это известная штука. Интересно будет посмотреть на работу Стаса про двухмерный!

Классная там у Вас по ссылке статья про Netflix Quantum Theory
http://www.theatlantic.com/technology/archive/2014/01/how-netflix-reverse-engineered-hollywood/282679/

Date: 2017-01-30 09:33 pm (UTC)
From: [identity profile] am.livejournal.com
В 2D все гораздо сложнее...
Про Netflix (http://techblog.netflix.com/2016_06_01_archive.html) - там есть ссылки
на статьи [6,7,9,10] в конце.

Я сейчас прочитал интервью в ТрВ, там, кажется,
речь одновременно о многих вещах шла. Вначале
- о BigData - под "похожими на биологические вещи",
как я бы понял, подразумевается, скорее, DeepLearning.
Затем, об MDS (Multi-dimensional scaling). Всякое ML,
в принципе, можно рассматривать как MDS. E.g. Structural
learning = nonlinear and linear MDS. Например, linear ICA,
sparse coding (a.k.a. compressed sensing) и др. методы
structural learning как раз и мотивированы missing data
и робастностью. (Structural learning в более широком
смысле, как structural features learning, например - здесь (https://pdfs.semanticscholar.org/b524/1dd7d74602186dd65fe05435fc65eae797e4.pdf),
а не в том авторства D.Wolpert & D.Braun et al (http://www.scholarpedia.org/article/Structural_learning).)
Затем речь о статьях P.W.Jones начиная с (http://internetanalysisseminar.gatech.edu/sites/default/files/Jones(1990).pdf).
Edited Date: 2018-03-03 12:50 am (UTC)

Date: 2017-01-30 10:17 pm (UTC)
From: [identity profile] kobak.livejournal.com
Я имею в виду high-throughput scRNA-seq, там все довольно фантастическое. Можно взять и секвенировать РНК из 25000 отдельных клеток так, чтобы на выходе знать, какие РНК из какой клетки (пример: http://www.cell.com/cell/abstract/S0092-8674(16)31007-8). Все РНК при этом высасываются из клеток и сливаются в один бульон, который потом и секвенируется, но надо же каждый фрагмент при этом пометить уникальным кодом, соответствующим клетке, из которой этот фрагмент достали.

Ну или т.н. patch-seq (http://www.nature.com/nbt/journal/v34/n2/abs/nbt.3445.html и http://www.nature.com/nbt/journal/v34/n2/abs/nbt.3443.html). Это совсем новые работы: сначала делают patch-clamp, записывают электрофизиологию, а потом прямо через ту же пипетку высасывают содержимое клетки и секвенируют РНК. Это, конечно, не high-throughput, а ручная работа, так что на выходе пока получается 100-200 клеток, но сочетание электрофизиологии и секвенирования впечатляет.

Date: 2017-02-05 01:58 pm (UTC)
From: [identity profile] vvz.livejournal.com
Интересно, с немецким Нанионом или датским Софионом авторы уже связались? High-throughput patch clamp системы уже давно используются и, говорят, крысиные нейроны на них тоже удается записывать. 384 клетки за раз и разгребай потом данные ;-)

Date: 2017-02-07 02:36 pm (UTC)
From: [identity profile] am.livejournal.com
Очень интересно. А есть у вас там семинар или Journal club, где об этих направлениях рассказывается? Или, м.б., какой приезжий гость с докладом в ближайшее время приглашен?

Date: 2017-02-07 07:26 pm (UTC)
From: [identity profile] kobak.livejournal.com
Вроде бы нет и нет, но если что-то появится или кто-то приедет, я дам знать.

Date: 2017-02-08 12:49 am (UTC)
From: [identity profile] am.livejournal.com
Спасибо.

Date: 2017-02-08 02:15 am (UTC)
From: [identity profile] vasja-iz-aa.livejournal.com
спасибо, прочитал первую статью -- они пытаются работать на качественном уровне(есть экспрессия гена/нет экспрессии). не думаю что у них получится, но хотя бы понятно почему возник интерес к пропущенным значениям. мне не кажется, что SVD with missing data удасться полезно применить к експрессионным данным. его уже пытались использовать в начале веке, для коррекции гибридизационных результатов. развития, насколько я знаю, эта техника и тогда не получила, хотя некоторая логика в теории была. а к резутатам современного RNA-Seq даже теоретически не очень понятно как он может быть полезен

Date: 2017-02-10 04:31 pm (UTC)
From: [identity profile] kobak.livejournal.com
Почему на качественном? Ну т.е. на marker genes они там тоже смотрят, но основная работа dimensionality reduction + clustering (Figure 1C) сделана на количественных уровнях экспрессии. Большое кол-во отсутствующих значений в data matrix может такой анализ сильно попортить. Но насколько эти значения можно восстановить тем или иным образом (не обязательно SVD), я пока не могу сказать.

Почему на качественном?

Date: 2017-02-10 07:35 pm (UTC)
From: [identity profile] vasja-iz-aa.livejournal.com
The median number of reads supporting each detected transcript was 4 (IQR 3-7), but this distribution was very wide (Figure S1B).
95% of non-zero gene-counts in the filtered matrix had a value less than or equal to 3 (75% 1’s, 16% 20s and 4% 30s), suggesting that
our data (given the shallow sequencing depth) primarily reflected presence/absence of transcripts and did not capture the full dynamic
range for most transcripts (Figure S1C).

Date: 2017-02-15 03:45 pm (UTC)
From: [identity profile] kobak.livejournal.com
Да, Вы правы: там очень "shallow" секвенирование, порядка 10 тыс. reads на клетку. Данные, с которыми я сейчас работаю (Cadwell et al 2016), -- это глубокое секвенирование, >1 млн reads на клетку.

Date: 2017-02-15 05:35 pm (UTC)
From: [identity profile] vasja-iz-aa.livejournal.com
не перечитывал, но вроде бы у них 8К в среднем детектированых транскриптов и пара сотен К полезных ридов на клетку

миллион все равно очень мало, при лобовом подходе на RNASeq надо 10-30 миллионов. в этом одна из основных проблем метода: в общем потоке секвинируется куча хорошо представленой но малоинтересной РНК,которая отжирает reads у важных и интересных исследователю генов

Date: 2017-08-08 07:54 pm (UTC)
From: [identity profile] nikaan.livejournal.com
вот статья про ящериц
http://www.nature.com/nature/journal/v544/n7649/abs/nature22031.html?foxtrotcallback=true

Date: 2017-08-08 08:12 pm (UTC)
From: [identity profile] kobak.livejournal.com
Класс, спасибо! Пролистал, выглядит интересно. Надо будет почитать.

Date: 2018-03-20 10:14 am (UTC)
From: [identity profile] a-konst.livejournal.com
Станислав замечательный.

А Гельфанд, как мне показалось, как-то слишком по-свойски, даже скажем, панибратски, с ним разговаривает, и пытается обсуждать науку на равных.
Конечно, он дбн и кфмн, (ну и заодно внук математика того же калибра, что его собеседник) но всё таки как-то режет глаз его стилистика, что он не чувствует, или сознательно не показывает, что чувствует, разницы в уровне, хотя на словах очень одобряет поддержание репутации, и пр.

Оффтоп (простите)

Date: 2019-10-21 02:48 am (UTC)
From: [identity profile] dvuobyomnyi.livejournal.com
(Простите за лютый оффтоп из ниоткуда даже без внятного начала)

Я чувствую, что что-то происходит с головой (не в психическом плане)/телом, попробую попасть к врачу на этой неделе, но до этого и параллельно с этим хочу ещё раз попробовать обсудить с кем-то свои идеи.

Диалог с Аввой (о том же) совсем не пошёл, но он обещал что-то написать на этой неделе (после неё?), однако это будет завершением общения и критикой (почему мои аргументы - софизмы, почему за моими словами ничего не стоит, почему у меня *мысли* нет; говорит оставить надежды).

Я читал вашу защиту платонизма (https://i-eron.livejournal.com/50225.html?thread=372785#t372785) и (ещё по этой записи) рассудил, что вы может быть будете не так жестоки (если вообще решите говорить!). (Даже не защита платонизма, а защита мнений других людей у вас.)

Вот что хочу обсудить: (там ещё одна ссылка, но всё читать совсем не надо)
https://dvuobyomnyi.livejournal.com/3053.html

P.S.: Решил попробовать написать иерону и вам, просто так, потому что могу (хоть какой-то дополнительный шанс, который не лень испробовать). Вы напоминаете мне хорошего человека, друга

Date: 2019-10-21 10:53 pm (UTC)
From: [identity profile] kobak.livejournal.com
Спасибо за добрые слова, но я, к сожалению, вообще не понял, о чем по ссылке речь и что именно Вы хотите обсудить... :-/

Date: 2019-10-22 05:57 am (UTC)
From: [identity profile] dvuobyomnyi.livejournal.com
Спасибо хотя бы за 1 ответ! Может темы для обсуждения и нет. Если что, сошлюсь на написанное в чате рационалистов (текст сохранён, можете тереть, если обсуждать нечего).

1) "Идеология" рациональности Элиезера это (зачастую) просто два [конкретных] слоя "(статичная) реальность + карта". Но не обязательно строить "идеологию" только для двух слоёв и не обязательно подразумевать их конкретные природу и роль (LW-рациональность это обрезок чего-то более глубокого). Двухслойными (плохо это или хорошо) ещё бывают теории и идеи об ИИ, например идея что интеллект предсказывает будущее (в этой идее есть два отдельных слоя, слой реальности и слой предсказаний). С двумя слоями эта идея работает на полную, а с большим количеством слоёв она менее ясна потому что, например, не описывает происходящего в мышлении (одни мысли предсказывают другие мысли?).

2) Можно представлять аргументы как (условные) "спектры" слоёв. Значимость "слоя" опоннента обычно выкручивается в абсолютный 0, а собственного в бесконечность (и эти слои разрубает подобие Гильотины Юма). В "ЧаВо о консеквенциализме" аргументация о морали в подобном стиле (но ещё больше такого у Элиезера). Много интересных возможностей (касающихся возникновения и выбора морали) упускаются. Однако не обязательно аргументировать в подобном стиле (используя столько подразумеваний о слоях). Вообще не понимаю смысла так аргументировать, кроме желания наверняка не понять других людей (но обидеть их).

3) Любые конкретные слои (типа формул морали) это просто способ выражать идеи, которые можно выражать и в отрыве от (слишком) конкретных слоёв. Избавляясь от слишком конкретных слоёв, можно получать более глубокие идеи. (Выбор более конкретного не всегда разумен.) Звучит банально, но обычно всё [всегда] наоборот (ценится лишь реализация уже известной идеи на каком-то новом слое). В итоге то что должно быть обменом знаниями превращается в конкурентное побоище (если тебе нечем развить метод конкурента, этот метод остаётся лишь отрицать). И от этого пункта можно (здесь косвенно, в тексте связь обоснованна) перейти к следующему:

4) Можно сказать, какие методы не сработают и какие проблемы не решат (или какие методы не имеет смысла доводить до рабочего состояния и какие проблемы решать). Bayesian Theory of Mind не сработает, упрощённый физ.движок не сработает (это лишь конкретный слой описания законов мира), Bayesian Program Learning не сработает, "причинность" и "композиционность" не сработают (причины и следствия и композиция это тоже лишь [слишком] конкретные слои). (https://arxiv.org/abs/1604.00289) Проблему пари Паскаля не решат (https://www.lesswrong.com/posts/a5JAiTdytou3Jg749/pascal-s-mugging-tiny-probabilities-of-vast-utilities), проблемы применения статистики не решат, идеальные формулы оценки и порождения гипотез и учёта чужих предпочтений не напишут (к этому и стремиться смысла нет. это убегание от проблемы интеллекта вместо решения). Разные теории и решения и попытки объяснить что-то это тоже "спектры" (решающие и объясняющие что-то в каких-то вырожденных случаях).

5) В общем, хотел узнать, могу ли подсказать кому-нибудь новые идеи о чём-то. (О рациональности или интеллекте.) Хотел (в тексте) дать метод "очищения" идей от неправильной конкретики.

6) Хочу помогать людям объединять свои теории (http://www.gotai.net/forum/default.aspx?threadid=286903#286903) (не читал, что там ответили пока).

Date: 2019-10-23 05:57 am (UTC)
From: [identity profile] kobak.livejournal.com
Судя по этому комментарию и по Вашим текстам по ссылкам, у Вас тут выстроена целая философия и Вы, кажется, хотите, чтобы я о ней как-то высказался? Прошу меня простить, но я не могу сейчас в нее вникать. Могу только сказать, что с первого взглядя -- вот просто с прочтения Вашего комментария -- мне тут вообще ничего не понятно, все слишком сумбурно.

Date: 2019-10-24 03:36 am (UTC)
From: [identity profile] dvuobyomnyi.livejournal.com
Простите меня за такую сомнительную затею! Я надеялся на то, что вас может зацепить какой-то конкретный аргумент (или возможность/потенциал аргумента) или на то что нечто пересечётся с вашими собственными мыслями и опытом (но я ещё и пишу плохо).

Как человека, верящего в ценность свободы и других людей могло бы заинтересовать/удивить, что эти ценности можно непосредственно заложить в основу идеологии (либерализм).

Простите за время.

Date: 2019-10-24 09:51 am (UTC)
From: [identity profile] kobak.livejournal.com
Совершенно не за что извиняться. Скорее это я должен извиниться, что не стал / не смог вникать.

Вы выше упомняли разговор с Аввой -- он где-то у него в жж? Можно попросить Вас дать ссылку? Любопытно.

Date: 2019-10-24 09:40 pm (UTC)
From: [identity profile] dvuobyomnyi.livejournal.com
Мне стыдно за своё поведение там, и начало там непонятное, и Авва мало что ответил пока именно про идеи и аргументы (обещал к концу недели). Поэтому простите, зажимаю ссылку! Пока написал в чат (slack) lesswrong.ru

Profile

kobak: (Default)
kobak

May 2026

S M T W T F S
     12
3456789
10111213 141516
17181920212223
24252627282930
31      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 23rd, 2026 08:47 pm
Powered by Dreamwidth Studios