смирнов про ящериц
Jan. 30th, 2017 03:47 pmИнтересное интервью Смирнова Гельфанду: http://trv-science.ru/2017/01/17/stanislav-smirnov-mathwalks/. Среди прочего, Смирнов говорит: "Последняя статья, которую я написал с коллегами, как раз по биологии. Мы изучаем раскраску конкретного семейства ящериц и показываем, что уравнения реакции-диффузии Тьюринга, связывающие концентрации хроматофоров, при переменных коэффициентах..." (тут Гельфанд его перебивает). Попытался найти эту статью и не могу; в архиве нет, в google scholar нет, на женевском сайте Смирнова нет, на сайте лаборатории Чебышева тоже нет. Может быть, статья еще не написана? Судя по разговору, непохоже: Гельфанд там хмыкает, мол, это простая математика и простая биология, а Смирнов ему на это -- ты не торопись, лучше почитай. Никто не знает, о чем речь?
Еще Смирнов рассказывает про (в ML хорошо известные) recommender systems для нетфликсовского конкурса на базе SVD with missing data и говорит, что это "похоже на биологические вещи". Это спорно, и Гельфанд сразу начинает спорить; но может быть, и правда похоже. Я вот как раз с нового года настраиваю что-то подобное для single cell RNA sequencing: технология фантастическая, но глубина секвенирования (пока?) не очень и существенный процент генов не детектируется, т.е. их уровень экспрессии измерен как нулевой, хотя на самом деле это missing value.
Еще Смирнов рассказывает про (в ML хорошо известные) recommender systems для нетфликсовского конкурса на базе SVD with missing data и говорит, что это "похоже на биологические вещи". Это спорно, и Гельфанд сразу начинает спорить; но может быть, и правда похоже. Я вот как раз с нового года настраиваю что-то подобное для single cell RNA sequencing: технология фантастическая, но глубина секвенирования (пока?) не очень и существенный процент генов не детектируется, т.е. их уровень экспрессии измерен как нулевой, хотя на самом деле это missing value.
no subject
Date: 2017-01-30 09:33 pm (UTC)Про Netflix (http://techblog.netflix.com/2016_06_01_archive.html) - там есть ссылки
на статьи [6,7,9,10] в конце.
Я сейчас прочитал интервью в ТрВ, там, кажется,
речь одновременно о многих вещах шла. Вначале
- о BigData - под "похожими на биологические вещи",
как я бы понял, подразумевается, скорее, DeepLearning.
Затем, об MDS (Multi-dimensional scaling). Всякое ML,
в принципе, можно рассматривать как MDS. E.g. Structural
learning = nonlinear and linear MDS. Например, linear ICA,
sparse coding (a.k.a. compressed sensing) и др. методы
structural learning как раз и мотивированы missing data
и робастностью. (Structural learning в более широком
смысле, как structural features learning, например - здесь (https://pdfs.semanticscholar.org/b524/1dd7d74602186dd65fe05435fc65eae797e4.pdf),
а не в том авторства D.Wolpert & D.Braun et al (http://www.scholarpedia.org/article/Structural_learning).)
Затем речь о статьях P.W.Jones начиная с (http://internetanalysisseminar.gatech.edu/sites/default/files/Jones(1990).pdf).