Спикер: Александр Крайнов - руководитель службы нейросетевых технологий и компьютерного зрения Яндекс


Многим ли из нас рассказывали на лекциях по линейной алгебре о прикладном применении матриц? Знаем ли мы о том, как изученные в школе и университете понятия, теоремы и формулы применяются в реальной жизни? В совместном проекте Центра непрерывного образования факультета компьютерных наук ВШЭ и проекта Дети и наука мы на простых примерах расскажем о том, какие математические понятия стоят за передовыми технологиями. Встречайте, первое видео — о математике, которая предугадывает наши предпочтения и объясняет, как создаются современные сериалы.


Я расскажу, почему именно сейчас Data Science оказывается одной из главных причин радикального изменения информационных технологий – а через них, в свою очередь, промышленности и жизни людей в целом. Ситуации, когда алгоритмы эффективно заменяют людей и меняют целые отрасли рассмотрены на примерах как сервисов Яндекса, так и некоторых других крупнейших мировых компаний. При этом наряду с повышением эффективности и другими достижениями возникают и неприятные побочные эффекты, способные в итоге повлиять на веками складывавшиеся в человеческом обществе институты – об этом тоже важно знать.


Докладчик: Михаил Гельфанд - Институт проблем передачи информации им. А.А. Харкевича РАН Я расскажу про основные информационные процессы, протекающие в клетке при реализации геномной программы. При этом я постараюсь избегать биохимических деталей, сосредоточившись на том, как это устроено на уровне общих принципов. Если позволят время и обстоятельства, я расскажу еще и о некоторых типичных задачах современной биоинформатики. Таким образом, доклад задумывается как crash course по молекулярной биологии для тех коллег, которые хотят понимать, чем занимаются биологи и про что разговаривают биоинформатики.


Антон Слесарев, руководитель группы распознавания образов, Яндекс


Человечество вступило в эпоху больших данных - время, когда объем доступной для анализа информации нарастает на порядки быстрее чем вычислительные мощности. Традиционные математические методы и модели в такой ситуации становятся неприменимы. Необходимо создание новой математики , адаптированной под новые соотношения между данными и вычислительными ресурсами. Как можно хранить и обрабатывать многомерные массивы в линейных по памяти структурах? Что дает обучение нейронных сетей из триллионов триллионов нейронов и как можно осуществить его без переобучения? Можно ли обрабатывать информацию на лету , не сохраняя поступающие последовательно данные? Как оптимизировать функцию за время меньшее чем уходит на ее вычисление в одной точке? Что дает обучение по слаборазмеченным данным? И почему для решения всех перечисленных выше задач надо хорошо знать математику? Ответы на эти вопросы будут рассмотрены в докладе.


Докладчик: Дмитрий Коробченко, NVIDIA Спикер расскажет о том, где и для чего сегодня применяется DL, насколько это эффективно по сравнению с иными подходами, покажет, как с этим работать, и укажет конкретные шаги, с которых следует начать.


Мастер-класс компании JetBrains Особенности и возможности PyCharm для начинающих разработчиков на Python


Спикер - Григорий Бакунов, директор по распространению технологий Яндекс


Спикер: Татьяна Ландо - компания Яндекс Диалоговые системы и чат-боты: как они устроены сейчас (правила, фреймы, шаблоны) и как машинное обучение может изменить их качество и применимость.


Выступят: Алексей Сидорин и Роман Чеботарев, эксперты КРОК Big Data– серия подходов, инструментов и методов обработки структурированных и неструктурированных данных больших объёмов и значительного многообразия для получения человеко-читаемых результатов, эффективных в условиях непрерывного прироста. Звучит сложно, но круто! Big Data - одна из самых ожидаемых инноваций текущего десятилетия. Сейчас она еще только на заре своего развития и очень важно понимать возможности и перспективы этих технологий. В рамках семинара мы расскажем: · про историю и перспективы развития концепции анализа больших данных · как и для чего сейчас используются технологии Big Data, приводя яркие примеры российского и международного опыта · какие существуют программные и аппаратные решения на рынке, показывая реальные системные архитектуры А возможно и покажем….


Спикер: Михаил Гельфанд - академический руководитель программы Анализ данных в биологии и медицине С развитием экспериментальных технологий изменился стиль занятий молекулярной биологией: к экспериментам с отдельными генами, белками и т.п. добавились массовые эксперименты, характеризующие клетку в целом: ее геном, работу генов, пространственную структуру ДНК, концентрацию белков, белок-белковые взаимодействия и т.п. Молекулярная биология стала наукой, богатой данными. Оказалось, что можно делать нетривиальные биологические утверждения, анализируя эти данные, и уже потом проверять их в эксперименте. Кроме того, сопоставляя получаемые описания различных организмов, мы можем существенно глубже понять их эволюцию.


Спикер: Первушин Д.Д., к.ф.-м.н., доцент кафедры технологий моделирования сложных систем


Спикер: Александр Крайнов, руководитель службы компьютерного зрения Яндекса Ссылка на презентацию:


Спикер: Андрей Райгородский - Московский государственный университет имени М.В. Ломоносова В 1959 году П. Эрдеш и А. Реньи начали изучать биномиальную модель случайного графа G(n, p), в которой ребра графа на n вершинах возникают взаимно независимо с одной и той же вероятностью p. За прошедшие десятилетия наука о случайных графах Эрдеша-Реньи сделалась одной из центральных дисциплин в области комбинаторики и ее приложений. Одно из наиболее естественных обобщений модели Эрдеша-Реньи состоит в следующем: берется некоторая последовательность графов Hn, и в каждом из графов Hn ребра сохраняются взаимно независимо с одной и той же вероятностью p. Возникают случайные графы Hn, p. В последнее время очень много исследований посвящено именно такому варианту модели Эрдеша-Реньи. Мы расскажем об одной последовательности графов, важной для комбинаторной геометрии и теории кодирования. Для этой последовательности графов мы рассмотрим описанный выше вариант модели Эрдеша-Реньи и обсудим различные старые и новые результаты, которые здесь удалось получить. В частности, речь пойдет о раскрасках таких случайных графов, об их кликовых числах и их числах независимости.


О докладчике: Иван Богатый работает в Google Research и учится в Stanford (CS dept). В прошлом выпускник мехмата МГУ и сотрудник отдела теоретических и прикладных исследований Яндекса TensorFlow - платформа для машинного обучения, недавно выпущенная Google в открытый доступ. Я расскажу, как ее использовать, на примере нескольких продуктов Google, в первую очередь - умных ответов на поисковые запросы. Одна из целей встречи - рассказать о работе в Google Research изнутри и обсудить со слушателями их карьерные и научные цели.


Speaker: Bernhard Ganter - Technische Universität Dresden We give impressions of a field of research that was started some 30 years ago under the name of “Formal Concept Analysis.” It is a mathematical theory, based on algebraic structures such as complete lattices, with a spectrum of applications in data analysis and knowledge processing Although the theory is advanced and substantial, it finds more attention in computer science than in mathematics. Indeed, the field has some potential for supporting recent developments of structured knowledge representations. In our lecture, we introduce the very basic notions of the field, show the possibility of expressive graphical representations, discuss some applications and, eventually, demonstrate why the value of this development lies in its mathematical nature.


Почему формальное определение цвета то ли есть, то ли нет, и связано ли это с тем, что его дал тот самый Шрёдингер? Что имел в виду Вейнберг, когда назвал свою революционную статью «Геометрия цветов»? Почему у цветового треугольника два угла, хотя интуитивно кажется, что должен быть один? Почему обычный детский рисунок показывает, что у автора всё в порядке с цветовосприятием, и зачем художник-академист всю жизнь учится его отключать? Почему в цветовом пространстве находятся кластеры, но они не находятся? Почему любая женщина знает о явлении метамерии окрасок, а ученые всё время забывают? Сколько должно быть цветовых каналов у хорошего фотоаппарата? А у монитора? А почему ответ разный? А красок у принтера?


Лектор: Григорий Бакунов - директор по распространению технологий, Яндекс Лекция для школьников в рамках Дней компьютерных наук


28.04.18. Лекция в СПбАУ , Институт биоинформатики С развитием высокопроизводительных экспериментальных методов, в первую очередь основанных на определении нуклеотидных последовательностей, молекулярная биология пошла по пути, проложенном астрофизикой и физикой высоких энергий: она стала наукой, богатой данными. Вместо изучения отдельных генов и белков стало возможным рассматривать работу клетки в целом. Но все имеет цену. В массовых данных много шума. Кроме того, вместо конкретных биологических фактов, объектом исследования становятся искусственные конструкты и модели, и уровень абстракции иногда становится непривычно высоким для биологов. Используя примеры из работ последнего времени, лектор попробует обсудить проблемы и перспективы формирующейся новой науки, системной биологии, и рассказать про примеры использования современных методов анализа данных. При этом лекция будет простой во всех аспектах и не требует предварительных знаний.


Спикер: Додонова Ю.А., сотрудник Сектора анализа данных в нейронауках ИППИ РАН, член НУГ Машинное обучение на данных нейроимаджинга


О пилотном потоке на ПМИ ФКН рассказывает Валентин Бирюков, выпускник СУНЦа и студент 1 курса образовательной программы бакалавриата Прикладная математика и информатика


Докладчик: Софья Кисельгоф - Международная научная лаборатория анализа и выбора решений НИУ ВШЭ На практике часто возникает задача распределения объектов или людей в пары друг с другом, например, распределение сотрудников по вакансиям, формирование комитетов, распределение абитуриентов по вузам и др. Доклад посвящен теории и практике построения механизмов такого распределения с учетом предпочтений индивидов.


Лекция Антона Слесарева, руководителя группы распознавания образов в компании “Яндекс”


Спикер: Дмитрий Петухов - Microsoft Certified Professional, Big Data Enthusiast, Data Dveloper @ OpenWay R&D Выступление Дмитрия Петухова было посвящено одной из последних тенденций в ИТ – облачным сервисам, предоставляющим машинное обучение как сервис (Machine Learning as a Service). В частности, подробно был рассмотрен облачный сервис предиктивной аналитики Azure Machine Learning, основные принципы и концепции, лежащие в основе Azure ML, а также возможности, которые сервис предоставляет специалистам в области data science. Часть выступления была посвящена секции «вопрос-ответ». Кроме того, прошло обсуждение, чем аналогичные сервисы могут быть полезны как небольшим стартапам, так и научным исследовательским группам. Ссылка на презентацию: Блог Дмитрия Петухова:


Спикер: Мурат Апишев - Разработчик в Группе алгоритмов антиспама компании Яндекс В ходе мастер-класса слушатели узнают о том, что такое тематическое моделирование, и о том, каковы его существующие и потенциальные применения в текстовой аналитике. Будут представлены как простейшие традиционные (LSA, LDA), так и более сложные современные модели, основанные на регуляризации. Будет произведён экскурс в возможности и интерфейсы open-source библиотеки тематического моделирования больших текстовых коллекций BigARTM. Изложение будет сопровождаться примерами, как модельными, так и реальными из проектов, с описанием программного кода и результатов. В ходе мастер-класса будет устроено мини-соревнование на kaggle. Мастер-класс по тематическому моделированию – отличная возможность освоить ещё один эффективный и гибкий инструмент машинного обучения.


Гасников Александр Владимирович рассказывает о новой магистерской программе факультета компьютерных наук высшей школы экономики.


Как решать сложные задачи машинного обучения, не понимая почти ничего (кроме самого главного) Сергей Бартунов - старший преподаватель департамента больших данных и информационного поиска факультета компьютерных наук НИУ ВШЭ


Спикер: Александр Крайнов - Яндекс


Докладчик: Борис Янгель, Компания «Яндекс» Вероятностное моделирование является одним из мощнейших инструментов для специалиста по анализу данных (data scientist). К сожалению, для его использования необходимо не только уверенно владеть аппаратом теории вероятностей и математической статистики, но и знать детали работы алгоритмов приближенного байесовского вывода, что делает порог вхождения очень высоким. В этом докладе я расскажу про сравнительно молодую парадигму в машинном обучении, вероятностное программирование, задача которой — сделать всю мощь вероятностного моделирования доступной любому человеку, имеющему опыт программирования и минимальный опыт анализа данных.


Лектор: Крумштейн Владимир - ведущий инженер департамента вычислительных систем КРОК. В рамках лекции будет рассказано о том, что такое облачные технологии, как они превратились из маркетингового buzz-word-а в повседневно используемые подходы. Не будет обойдён стороной вопрос о том, как собрать и запустить облако из открытых компонент. На встрече будет показано, как создаются гибкие, отказоустойчивые и открытые инфраструктуры.


Спикер - Роман Удовиченко, руководитель группы обработки дорожной ситуации Яндекс


Лектор - В.А. Гурвич, профессор Университа Ратгерса (США) и ведущий научный сотрудник международной лаборатории теоретической информатики (ВШЭ)


Докладчик: Александр Новиков - ФКН ВШЭ/ИВМ РАН Разложение в тензорный поезд (Tensor Train, ТТ) — это обобщение SVD-разложения на тензоры (многомерные массивы). Этот подход позволяет компактно представить тензор в виде произведения факторов и совершать над ним операции посредством работы с факторами, не материализуя исходный тензор в процессе. Например, можно найти ТТ-представление поэлементного произведения двух тензоров размера 2100, заданных в виде ТТ-представления. В докладе я расскажу как ТТ-разложение может быть использовано для представления параметров моделей машинного обучения на примере полиномиальных моделей и нейронных сетей. Такая параметризация позволяет обучать модели у которых экспоненциально много виртуальных параметров, работая при этом на практике с относительно небольшими факторами ТТ-формата.


0:40 Иван Владимирович Аржанцев - декан факультета 13:51 Антон Сергеевич Конушин - Руководитель программы Прикладная математика и информатика 26:57 Алексей Зобнин - преподаватель Основы и методологии программирования 33:03 Евгений Юртаев - студент образовательной программы Прикладная математика и информатика 35:57 Дмитрий Марков - студент образовательной программы Прикладная математика и информатика 40:48 Константин Юрьевич Дегтярев - академический руководитель Программная инженерия 57:09 Артем Матвеенков - студент образовательной программы Программная инженерия 1:04:48 Максим Минц - студент образовательной программы Программная инженерия 1:10:51 Елена Сибирцева - студентка магистратуры Системная и программная инженерия 1:13:29 Факультет довузовской подготовки 1:16:44 Кирилл Купцов - начальник отдела по работе с абитуриентами


Докладчик: Виктор Лемпицкий - Сколковский Институт Науки и Технологий (Сколтех) Глубокие нейросети за последние три года научились классифицировать изображения с точностью, почти сравнимой с человеческим мозгом. Но могут ли они синтезировать изображения и потеснить классические методы компьютерной графики и обработки изображений? О первых успехах в этом направлении, достигнутых исследователями за последние два года, пойдет речь в докладе.


Ссылка на полную версию: Проектная работа у студентов первого курса Прикладной математики и информатики началась с 3-го модуля, после сдачи курсов по программированию на Python и С++. За каждым студентом был закреплен ментор-наставник из индустрии или научной среды, который ставил задачи и курировал процесс их выполнения. Каждый студент должен был выбрать один из 53 возможных проектов. Менторы предложили самые разные проекты — от биоинформатики до компьютерной лингвистики, машинного обучения и разработки игр, веб-сервисы, архивацию, задачу коммивояжера, проекты про финансы и др. В течение всей весны студенты упорно работали: предполагалось еженедельное общение с ментором. По итогам двух модулей менторы выдвинули лучших студентов на конкурс проектов, а кураторы проектного семинара отобрали 12 финалистов. В результате презентации проект “Распознавание рукописных цифр при помощи многослойной нейронной сети” занял первое место, “Игра Rally для Oculus Rift” и “Задача коммивояжера” — второе место, а “Утилита для очистки текстов от обсценной лексики” и “Web-сайт на клиентских технологиях” — третье. Призом зрительских симпатий были отмечены проекты “Социальный портрет по профилю в Instagram” и “Игра с драконом для Oculus Rift”.


Спикер: Дмитрий Ульянов, Сколтех Год назад были предложены новые алгоритмы для переноса стиля и синтеза текстур на основе нейросетей, а после был разработан метод так называемых нейросетевых дудлов. Все эти идеи работали так хорошо, что быстро нашли свое применение в некоторых программах по обработке изображений. Все же для обработки фото, например, на телефоне методы были неприменимы, так как требовали значительных ресурсов. В нашей недавней работе мы представили идею ускорения предыдущих методов в 500 раз, которая в дальнейшем была использована в нескольких известных приложениях для стилизации изображений. В этом докладе я расскажу как про быстрый, так и про медленный алгоритмы стилизации, генерации текстур и дудлов.


Программа мероприятия: 1. Обсуждение формата заданий. 2. Разбор списка источников и рекомендации по подготовке. 3. Разбор задач из демо-варианта (по запросу).


Консультация для участников Олимпиады НИУ ВШЭ для студентов и выпускников по направлению «Прикладная математика и информатика»


Определение ближайших соседей является подзадачей многих алгоритмов анализа данных, компьютерного зрения и других прикладных областей. Самый очевидный и наивный метод поиска ближайших соседей – полный перебор. Но при больших объемах поисковой базы полный перебор становится несостоятельным из-за своей вычислительной сложности, и необходимо использовать более быстрые приближенные алгоритмы. Одним из самых распространенных подходов является построение инвертированного индекса, который делит поисковое пространство на непересекающиеся регионы и осуществляет поиск только в небольшом количестве регионов, являющихся наиболее перспективными для конкретного запроса. В докладе будут описаны две структуры данных, обобщающие идею стандартного инвертированного индекса, позволяющие осуществлять поиск ближайших соседей в базах, содержащих миллиарды векторов, за несколько миллисекунд. Практическая применимость предложенных методов подтверждена экспериментально на нескольких поисковых базах из задач компьютерного зрения.


Мини-курс В.Н. Брагилевского: «Функциональное программирование с зависимыми типами на языке Idris» Язык программирования Idris — это современный язык общего назначения, его первая версия была выпущена 1 апреля 2017 года. Он поддерживает функциональный стиль программирования и является наследником языка программирования Haskell, но в отличие от последнего реализует строгие вычисления и имеет более богатую систему типизации, а именно зависимые типы. Основная цель языка Idris состоит в том, чтобы применять возможности зависимых типов по более или менее точному специфицированию намерений разработчика программного обеспечения в практических задачах. Курс будет посвящён различным аспектам программирования на языке Idris, таким как функции на типах и зависимые типы, интерфейсы, выражение отношений между данными, представления, тотальность и верификация бесконечно работающих программ, управление состоянием. Также будут рассмотрены существенные для разработки корректного программного обеспечения элементы функционального программирования и теории типов.


Видео добавлено: