Спикер: Александр Крайнов - руководитель службы нейросетевых технологий и компьютерного зрения Яндекс


Докладчик: Михаил Гельфанд - Институт проблем передачи информации им. А.А. Харкевича РАН Я расскажу про основные информационные процессы, протекающие в клетке при реализации геномной программы. При этом я постараюсь избегать биохимических деталей, сосредоточившись на том, как это устроено на уровне общих принципов. Если позволят время и обстоятельства, я расскажу еще и о некоторых типичных задачах современной биоинформатики. Таким образом, доклад задумывается как crash course по молекулярной биологии для тех коллег, которые хотят понимать, чем занимаются биологи и про что разговаривают биоинформатики.


Я расскажу, почему именно сейчас Data Science оказывается одной из главных причин радикального изменения информационных технологий – а через них, в свою очередь, промышленности и жизни людей в целом. Ситуации, когда алгоритмы эффективно заменяют людей и меняют целые отрасли рассмотрены на примерах как сервисов Яндекса, так и некоторых других крупнейших мировых компаний. При этом наряду с повышением эффективности и другими достижениями возникают и неприятные побочные эффекты, способные в итоге повлиять на веками складывавшиеся в человеческом обществе институты – об этом тоже важно знать.


Антон Слесарев, руководитель группы распознавания образов, Яндекс


Человечество вступило в эпоху больших данных - время, когда объем доступной для анализа информации нарастает на порядки быстрее чем вычислительные мощности. Традиционные математические методы и модели в такой ситуации становятся неприменимы. Необходимо создание новой математики , адаптированной под новые соотношения между данными и вычислительными ресурсами. Как можно хранить и обрабатывать многомерные массивы в линейных по памяти структурах? Что дает обучение нейронных сетей из триллионов триллионов нейронов и как можно осуществить его без переобучения? Можно ли обрабатывать информацию на лету , не сохраняя поступающие последовательно данные? Как оптимизировать функцию за время меньшее чем уходит на ее вычисление в одной точке? Что дает обучение по слаборазмеченным данным? И почему для решения всех перечисленных выше задач надо хорошо знать математику? Ответы на эти вопросы будут рассмотрены в докладе.


Докладчик: Дмитрий Коробченко, NVIDIA Спикер расскажет о том, где и для чего сегодня применяется DL, насколько это эффективно по сравнению с иными подходами, покажет, как с этим работать, и укажет конкретные шаги, с которых следует начать.


Мастер-класс компании JetBrains Особенности и возможности PyCharm для начинающих разработчиков на Python


Спикер - Григорий Бакунов, директор по распространению технологий Яндекс


Почему формальное определение цвета то ли есть, то ли нет, и связано ли это с тем, что его дал тот самый Шрёдингер? Что имел в виду Вейнберг, когда назвал свою революционную статью «Геометрия цветов»? Почему у цветового треугольника два угла, хотя интуитивно кажется, что должен быть один? Почему обычный детский рисунок показывает, что у автора всё в порядке с цветовосприятием, и зачем художник-академист всю жизнь учится его отключать? Почему в цветовом пространстве находятся кластеры, но они не находятся? Почему любая женщина знает о явлении метамерии окрасок, а ученые всё время забывают? Сколько должно быть цветовых каналов у хорошего фотоаппарата? А у монитора? А почему ответ разный? А красок у принтера?


О докладчике: Иван Богатый работает в Google Research и учится в Stanford (CS dept). В прошлом выпускник мехмата МГУ и сотрудник отдела теоретических и прикладных исследований Яндекса TensorFlow - платформа для машинного обучения, недавно выпущенная Google в открытый доступ. Я расскажу, как ее использовать, на примере нескольких продуктов Google, в первую очередь - умных ответов на поисковые запросы. Одна из целей встречи - рассказать о работе в Google Research изнутри и обсудить со слушателями их карьерные и научные цели.


Выступят: Алексей Сидорин и Роман Чеботарев, эксперты КРОК Big Data– серия подходов, инструментов и методов обработки структурированных и неструктурированных данных больших объёмов и значительного многообразия для получения человеко-читаемых результатов, эффективных в условиях непрерывного прироста. Звучит сложно, но круто! Big Data - одна из самых ожидаемых инноваций текущего десятилетия. Сейчас она еще только на заре своего развития и очень важно понимать возможности и перспективы этих технологий. В рамках семинара мы расскажем: · про историю и перспективы развития концепции анализа больших данных · как и для чего сейчас используются технологии Big Data, приводя яркие примеры российского и международного опыта · какие существуют программные и аппаратные решения на рынке, показывая реальные системные архитектуры А возможно и покажем….


Спикер: Михаил Гельфанд - академический руководитель программы Анализ данных в биологии и медицине С развитием экспериментальных технологий изменился стиль занятий молекулярной биологией: к экспериментам с отдельными генами, белками и т.п. добавились массовые эксперименты, характеризующие клетку в целом: ее геном, работу генов, пространственную структуру ДНК, концентрацию белков, белок-белковые взаимодействия и т.п. Молекулярная биология стала наукой, богатой данными. Оказалось, что можно делать нетривиальные биологические утверждения, анализируя эти данные, и уже потом проверять их в эксперименте. Кроме того, сопоставляя получаемые описания различных организмов, мы можем существенно глубже понять их эволюцию.


Лектор: Григорий Бакунов - директор по распространению технологий, Яндекс Лекция для школьников в рамках Дней компьютерных наук


Докладчик: Борис Янгель, Компания «Яндекс» Вероятностное моделирование является одним из мощнейших инструментов для специалиста по анализу данных (data scientist). К сожалению, для его использования необходимо не только уверенно владеть аппаратом теории вероятностей и математической статистики, но и знать детали работы алгоритмов приближенного байесовского вывода, что делает порог вхождения очень высоким. В этом докладе я расскажу про сравнительно молодую парадигму в машинном обучении, вероятностное программирование, задача которой — сделать всю мощь вероятностного моделирования доступной любому человеку, имеющему опыт программирования и минимальный опыт анализа данных.


Speaker: Bernhard Ganter - Technische Universität Dresden We give impressions of a field of research that was started some 30 years ago under the name of “Formal Concept Analysis.” It is a mathematical theory, based on algebraic structures such as complete lattices, with a spectrum of applications in data analysis and knowledge processing Although the theory is advanced and substantial, it finds more attention in computer science than in mathematics. Indeed, the field has some potential for supporting recent developments of structured knowledge representations. In our lecture, we introduce the very basic notions of the field, show the possibility of expressive graphical representations, discuss some applications and, eventually, demonstrate why the value of this development lies in its mathematical nature.


Спикер: Татьяна Ландо - компания Яндекс Диалоговые системы и чат-боты: как они устроены сейчас (правила, фреймы, шаблоны) и как машинное обучение может изменить их качество и применимость.


Спикер: Дмитрий Петухов - Microsoft Certified Professional, Big Data Enthusiast, Data Dveloper @ OpenWay R&D Выступление Дмитрия Петухова было посвящено одной из последних тенденций в ИТ – облачным сервисам, предоставляющим машинное обучение как сервис (Machine Learning as a Service). В частности, подробно был рассмотрен облачный сервис предиктивной аналитики Azure Machine Learning, основные принципы и концепции, лежащие в основе Azure ML, а также возможности, которые сервис предоставляет специалистам в области data science. Часть выступления была посвящена секции «вопрос-ответ». Кроме того, прошло обсуждение, чем аналогичные сервисы могут быть полезны как небольшим стартапам, так и научным исследовательским группам. Ссылка на презентацию: Блог Дмитрия Петухова:


Лектор - В.А. Гурвич, профессор Университа Ратгерса (США) и ведущий научный сотрудник международной лаборатории теоретической информатики (ВШЭ)


Докладчик: Виктор Лемпицкий - Сколковский Институт Науки и Технологий (Сколтех) Глубокие нейросети за последние три года научились классифицировать изображения с точностью, почти сравнимой с человеческим мозгом. Но могут ли они синтезировать изображения и потеснить классические методы компьютерной графики и обработки изображений? О первых успехах в этом направлении, достигнутых исследователями за последние два года, пойдет речь в докладе.


Спикер: Александр Крайнов - Яндекс


Спикер: Андрей Райгородский - Московский государственный университет имени М.В. Ломоносова В 1959 году П. Эрдеш и А. Реньи начали изучать биномиальную модель случайного графа G(n, p), в которой ребра графа на n вершинах возникают взаимно независимо с одной и той же вероятностью p. За прошедшие десятилетия наука о случайных графах Эрдеша-Реньи сделалась одной из центральных дисциплин в области комбинаторики и ее приложений. Одно из наиболее естественных обобщений модели Эрдеша-Реньи состоит в следующем: берется некоторая последовательность графов Hn, и в каждом из графов Hn ребра сохраняются взаимно независимо с одной и той же вероятностью p. Возникают случайные графы Hn, p. В последнее время очень много исследований посвящено именно такому варианту модели Эрдеша-Реньи. Мы расскажем об одной последовательности графов, важной для комбинаторной геометрии и теории кодирования. Для этой последовательности графов мы рассмотрим описанный выше вариант модели Эрдеша-Реньи и обсудим различные старые и новые результаты, которые здесь удалось получить. В частности, речь пойдет о раскрасках таких случайных графов, об их кликовых числах и их числах независимости.


Спикер: Дмитрий Ульянов, Сколтех Год назад были предложены новые алгоритмы для переноса стиля и синтеза текстур на основе нейросетей, а после был разработан метод так называемых нейросетевых дудлов. Все эти идеи работали так хорошо, что быстро нашли свое применение в некоторых программах по обработке изображений. Все же для обработки фото, например, на телефоне методы были неприменимы, так как требовали значительных ресурсов. В нашей недавней работе мы представили идею ускорения предыдущих методов в 500 раз, которая в дальнейшем была использована в нескольких известных приложениях для стилизации изображений. В этом докладе я расскажу как про быстрый, так и про медленный алгоритмы стилизации, генерации текстур и дудлов.


Лекция Антона Слесарева, руководителя группы распознавания образов в компании “Яндекс”


Магистерская программа «Анализ данных в биологии и медицине». «Биоинформатика: молекулярная биология in silico» Спикер: Гельфанд М.С., д.б.н., профессор кафедры технологий моделирования сложных систем, академический руководитель образовательной программы “Анализ данных в биологии и медицине”


Лектор: Сергей Пронин - департамент Программной инженерии ФКН ВШЭ Лекция для школьников в рамках Дней компьютерных наук


Спикер: Первушин Д.Д., к.ф.-м.н., доцент кафедры технологий моделирования сложных систем


Лектор: Крумштейн Владимир - ведущий инженер департамента вычислительных систем КРОК. В рамках лекции будет рассказано о том, что такое облачные технологии, как они превратились из маркетингового buzz-word-а в повседневно используемые подходы. Не будет обойдён стороной вопрос о том, как собрать и запустить облако из открытых компонент. На встрече будет показано, как создаются гибкие, отказоустойчивые и открытые инфраструктуры.


Как решать сложные задачи машинного обучения, не понимая почти ничего (кроме самого главного) Сергей Бартунов - старший преподаватель департамента больших данных и информационного поиска факультета компьютерных наук НИУ ВШЭ


Спикер - Роман Удовиченко, руководитель группы обработки дорожной ситуации Яндекс


0:40 Иван Владимирович Аржанцев - декан факультета 13:51 Антон Сергеевич Конушин - Руководитель программы Прикладная математика и информатика 26:57 Алексей Зобнин - преподаватель Основы и методологии программирования 33:03 Евгений Юртаев - студент образовательной программы Прикладная математика и информатика 35:57 Дмитрий Марков - студент образовательной программы Прикладная математика и информатика 40:48 Константин Юрьевич Дегтярев - академический руководитель Программная инженерия 57:09 Артем Матвеенков - студент образовательной программы Программная инженерия 1:04:48 Максим Минц - студент образовательной программы Программная инженерия 1:10:51 Елена Сибирцева - студентка магистратуры Системная и программная инженерия 1:13:29 Факультет довузовской подготовки 1:16:44 Кирилл Купцов - начальник отдела по работе с абитуриентами


Докладчик: Александр Новиков - ФКН ВШЭ/ИВМ РАН Разложение в тензорный поезд (Tensor Train, ТТ) — это обобщение SVD-разложения на тензоры (многомерные массивы). Этот подход позволяет компактно представить тензор в виде произведения факторов и совершать над ним операции посредством работы с факторами, не материализуя исходный тензор в процессе. Например, можно найти ТТ-представление поэлементного произведения двух тензоров размера 2100, заданных в виде ТТ-представления. В докладе я расскажу как ТТ-разложение может быть использовано для представления параметров моделей машинного обучения на примере полиномиальных моделей и нейронных сетей. Такая параметризация позволяет обучать модели у которых экспоненциально много виртуальных параметров, работая при этом на практике с относительно небольшими факторами ТТ-формата.


Ольга Ляшевская – к.ф.н., профессор факультета гуманитарных наук НИУ ВШЭ Борис Орехов – к.ф.н., доцент факультета гуманитарных наук НИУ ВШЭ Екатерина Рахилина – д.ф.н., профессор факультета гуманитарных наук НИУ ВШЭ Что такое лингвистическая ошибка? Можно ли ее вычислить? Автоматически найти? Исправить? Предупредить? Об этой и других задачах современной лингвистики расскажут сотрудники Школы лингвистики НИУ ВШЭ.


Программа мероприятия: 1. Обсуждение формата заданий. 2. Разбор списка источников и рекомендации по подготовке. 3. Разбор задач из демо-варианта (по запросу).


Тема выступления: Моделирование и анализ вычислительных процессов Докладчик: Ростислав Яворский - доцент департамента анализа данных и искусственного интеллекта ФКН Машины Тьюринга, Поста, Минского, алгорифмы Маркова, рекурсивные функции Клини были придуманы в первой половине двадцатого века в результате попыток формализовать понятие алгоритма. Эти математические модели до сих пор успешно применяются для решения задач разрешимости и алгоритмической сложности, но бесполезны для моделирования поведения сетевых протоколов или компонентов операционной системы. В рамках доклада будут представлены некоторые современные подходы к моделированию вычислений, которые используются в индустрии при разработке сложных информационных систем.


Определение ближайших соседей является подзадачей многих алгоритмов анализа данных, компьютерного зрения и других прикладных областей. Самый очевидный и наивный метод поиска ближайших соседей – полный перебор. Но при больших объемах поисковой базы полный перебор становится несостоятельным из-за своей вычислительной сложности, и необходимо использовать более быстрые приближенные алгоритмы. Одним из самых распространенных подходов является построение инвертированного индекса, который делит поисковое пространство на непересекающиеся регионы и осуществляет поиск только в небольшом количестве регионов, являющихся наиболее перспективными для конкретного запроса. В докладе будут описаны две структуры данных, обобщающие идею стандартного инвертированного индекса, позволяющие осуществлять поиск ближайших соседей в базах, содержащих миллиарды векторов, за несколько миллисекунд. Практическая применимость предложенных методов подтверждена экспериментально на нескольких поисковых базах из задач компьютерного зрения.


Докладчик: Александр Шень В середине XX века Шеннон ввёл понятие энтропии, которое можно интуитивно описать как среднее количестве битов информации в одном значении случайной величины. Но его нельзя применить к индивидуальным объектам (скажем, к тексту романа или ДНК) - где нет ансамбля многих однородных объектов, нет и случайных величин. В середине 1960х годов разным людям (Колмогоров, Соломонов, Левин, Чейтин.) стало понятно, что можно определять количество информации (сложность) индивидуального объекта как минимальную длину программы, которая этот объект порождает (при естественных ограничениях на язык программирования). Возникла алгоритмическая теория информации, которая оказалась связанной с разными областями: от философских вопросов оснований теории вероятностей (когда мы отвергаем статистические гипотезы?) до комбинаторики (неравенства, связывающие размеры множеств и их проекций) и теории вычислимости. Я попытаюсь рассказать основные определения и какие-то из базовых результатов, а также (в зависимости от пожеланий аудитории) что-то про более современные работы.


Докладчик: Константин Обухов - Data Scientist, Clever Data Статистика как наука была сформирована достаточно давно. Однако, настоящие задачи применения методов статистического анализа и математического моделирования появились с развитием инфраструктуры хранения и обработки данных. Сегодня, Data Scientist - профессия, связанная с построением различных моделей, основанных на данных, стала одной из самых востребованных должностей во всем мире. Data Science превращает объем, скорость и разнообразие Big Data в знания, которые позволяют вывести бизнес на новый уровень. Наука о данных сочетает в себе множество методов обработки, анализа и моделирования различной структурированной и неструктурированной информации. Однако, как и в любой науке, любая ошибка может привести к неверным результатам. В рамках лекции Data Scientist из CleverDATA расскажет о том, какие ошибки нельзя допускать в анализе данных, и как эти ошибки отражались на результатах конкретных исследований.


Консультация для участников Олимпиады НИУ ВШЭ для студентов и выпускников по направлению «Прикладная математика и информатика»


Докладчик: Антон Осокин, НИУ ВШЭ За последние несколько лет технологии глубинного обучения позволили получить выдающиеся практические результаты в таких прикладных областях как компьютерное зрение и обработка естественного языка. Для создания моделей для практических задач чаще всего используют блоки (слои) из небольшого списка стандартных операций (полно-связные, свёрточные, рекуррентные слои). Ограниченность такого набора является одним из препятствий для переноса технологий на новые задачи. С другой стороны, для многих задач уже накоплено большое количество алгоритмов и практик, позволяющих получать хорошие результаты. Возможно ли строить глубинные модели не с чистого листа, а на основе уже существующих не-нейросетевых решений? В рамках этого доклада мы рассмотрим несколько способов построения нейросетей (или слоев нейросетей) на основе существующих алгоритмов из компьютерных наук. Будут затронуты прямое разворачивание алгоритмов в слои нейросетей, использование комбинаторной оптимизации для выбора активаций сети, дифференцирование результатов алгоритмов по входам. Мы посмотрим, как применять эти подходы на примере задач предсказания со структурированным выходом (structured-output prediction) и на их применения в задачах компьютерного зрения.


Спикер: Савицкий М., аспирант департамента программной инженерии ФКН


Ссылка на полную версию: Проектная работа у студентов первого курса Прикладной математики и информатики началась с 3-го модуля, после сдачи курсов по программированию на Python и С++. За каждым студентом был закреплен ментор-наставник из индустрии или научной среды, который ставил задачи и курировал процесс их выполнения. Каждый студент должен был выбрать один из 53 возможных проектов. Менторы предложили самые разные проекты — от биоинформатики до компьютерной лингвистики, машинного обучения и разработки игр, веб-сервисы, архивацию, задачу коммивояжера, проекты про финансы и др. В течение всей весны студенты упорно работали: предполагалось еженедельное общение с ментором. По итогам двух модулей менторы выдвинули лучших студентов на конкурс проектов, а кураторы проектного семинара отобрали 12 финалистов. В результате презентации проект “Распознавание рукописных цифр при помощи многослойной нейронной сети” занял первое место, “Игра Rally для Oculus Rift” и “Задача коммивояжера” — второе место, а “Утилита для очистки текстов от обсценной лексики” и “Web-сайт на клиентских технологиях” — третье. Призом зрительских симпатий были отмечены проекты “Социальный портрет по профилю в Instagram” и “Игра с драконом для Oculus Rift”.


Видео добавлено: