Спикер: Александр Крайнов - руководитель службы нейросетевых технологий и компьютерного зрения Яндекс


Я расскажу, почему именно сейчас Data Science оказывается одной из главных причин радикального изменения информационных технологий – а через них, в свою очередь, промышленности и жизни людей в целом. Ситуации, когда алгоритмы эффективно заменяют людей и меняют целые отрасли рассмотрены на примерах как сервисов Яндекса, так и некоторых других крупнейших мировых компаний. При этом наряду с повышением эффективности и другими достижениями возникают и неприятные побочные эффекты, способные в итоге повлиять на веками складывавшиеся в человеческом обществе институты – об этом тоже важно знать.


Многим ли из нас рассказывали на лекциях по линейной алгебре о прикладном применении матриц? Знаем ли мы о том, как изученные в школе и университете понятия, теоремы и формулы применяются в реальной жизни? В совместном проекте Центра непрерывного образования факультета компьютерных наук ВШЭ и проекта Дети и наука мы на простых примерах расскажем о том, какие математические понятия стоят за передовыми технологиями. Встречайте, первое видео — о математике, которая предугадывает наши предпочтения и объясняет, как создаются современные сериалы.


Антон Слесарев, руководитель группы распознавания образов, Яндекс


Докладчик: Михаил Гельфанд - Институт проблем передачи информации им. А.А. Харкевича РАН Я расскажу про основные информационные процессы, протекающие в клетке при реализации геномной программы. При этом я постараюсь избегать биохимических деталей, сосредоточившись на том, как это устроено на уровне общих принципов. Если позволят время и обстоятельства, я расскажу еще и о некоторых типичных задачах современной биоинформатики. Таким образом, доклад задумывается как crash course по молекулярной биологии для тех коллег, которые хотят понимать, чем занимаются биологи и про что разговаривают биоинформатики.


Спикер: Александр Крайнов, руководитель службы компьютерного зрения Яндекса Ссылка на презентацию:


Мастер-класс компании JetBrains Особенности и возможности PyCharm для начинающих разработчиков на Python


Спикер - Григорий Бакунов, директор по распространению технологий Яндекс


Докладчик: Дмитрий Коробченко, NVIDIA Спикер расскажет о том, где и для чего сегодня применяется DL, насколько это эффективно по сравнению с иными подходами, покажет, как с этим работать, и укажет конкретные шаги, с которых следует начать.


Выступят: Алексей Сидорин и Роман Чеботарев, эксперты КРОК Big Data– серия подходов, инструментов и методов обработки структурированных и неструктурированных данных больших объёмов и значительного многообразия для получения человеко-читаемых результатов, эффективных в условиях непрерывного прироста. Звучит сложно, но круто! Big Data - одна из самых ожидаемых инноваций текущего десятилетия. Сейчас она еще только на заре своего развития и очень важно понимать возможности и перспективы этих технологий. В рамках семинара мы расскажем: · про историю и перспективы развития концепции анализа больших данных · как и для чего сейчас используются технологии Big Data, приводя яркие примеры российского и международного опыта · какие существуют программные и аппаратные решения на рынке, показывая реальные системные архитектуры А возможно и покажем….


Человечество вступило в эпоху больших данных - время, когда объем доступной для анализа информации нарастает на порядки быстрее чем вычислительные мощности. Традиционные математические методы и модели в такой ситуации становятся неприменимы. Необходимо создание новой математики , адаптированной под новые соотношения между данными и вычислительными ресурсами. Как можно хранить и обрабатывать многомерные массивы в линейных по памяти структурах? Что дает обучение нейронных сетей из триллионов триллионов нейронов и как можно осуществить его без переобучения? Можно ли обрабатывать информацию на лету , не сохраняя поступающие последовательно данные? Как оптимизировать функцию за время меньшее чем уходит на ее вычисление в одной точке? Что дает обучение по слаборазмеченным данным? И почему для решения всех перечисленных выше задач надо хорошо знать математику? Ответы на эти вопросы будут рассмотрены в докладе.


Почему формальное определение цвета то ли есть, то ли нет, и связано ли это с тем, что его дал тот самый Шрёдингер? Что имел в виду Вейнберг, когда назвал свою революционную статью «Геометрия цветов»? Почему у цветового треугольника два угла, хотя интуитивно кажется, что должен быть один? Почему обычный детский рисунок показывает, что у автора всё в порядке с цветовосприятием, и зачем художник-академист всю жизнь учится его отключать? Почему в цветовом пространстве находятся кластеры, но они не находятся? Почему любая женщина знает о явлении метамерии окрасок, а ученые всё время забывают? Сколько должно быть цветовых каналов у хорошего фотоаппарата? А у монитора? А почему ответ разный? А красок у принтера?


Спикер: Михаил Гельфанд - академический руководитель программы Анализ данных в биологии и медицине С развитием экспериментальных технологий изменился стиль занятий молекулярной биологией: к экспериментам с отдельными генами, белками и т.п. добавились массовые эксперименты, характеризующие клетку в целом: ее геном, работу генов, пространственную структуру ДНК, концентрацию белков, белок-белковые взаимодействия и т.п. Молекулярная биология стала наукой, богатой данными. Оказалось, что можно делать нетривиальные биологические утверждения, анализируя эти данные, и уже потом проверять их в эксперименте. Кроме того, сопоставляя получаемые описания различных организмов, мы можем существенно глубже понять их эволюцию.


О докладчике: Иван Богатый работает в Google Research и учится в Stanford (CS dept). В прошлом выпускник мехмата МГУ и сотрудник отдела теоретических и прикладных исследований Яндекса TensorFlow - платформа для машинного обучения, недавно выпущенная Google в открытый доступ. Я расскажу, как ее использовать, на примере нескольких продуктов Google, в первую очередь - умных ответов на поисковые запросы. Одна из целей встречи - рассказать о работе в Google Research изнутри и обсудить со слушателями их карьерные и научные цели.


Speaker: Bernhard Ganter - Technische Universität Dresden We give impressions of a field of research that was started some 30 years ago under the name of “Formal Concept Analysis.” It is a mathematical theory, based on algebraic structures such as complete lattices, with a spectrum of applications in data analysis and knowledge processing Although the theory is advanced and substantial, it finds more attention in computer science than in mathematics. Indeed, the field has some potential for supporting recent developments of structured knowledge representations. In our lecture, we introduce the very basic notions of the field, show the possibility of expressive graphical representations, discuss some applications and, eventually, demonstrate why the value of this development lies in its mathematical nature.


Лектор: Григорий Бакунов - директор по распространению технологий, Яндекс Лекция для школьников в рамках Дней компьютерных наук


Спикер: Первушин Д.Д., к.ф.-м.н., доцент кафедры технологий моделирования сложных систем


Спикер: Татьяна Ландо - компания Яндекс Диалоговые системы и чат-боты: как они устроены сейчас (правила, фреймы, шаблоны) и как машинное обучение может изменить их качество и применимость.


Ольга Ляшевская – к.ф.н., профессор факультета гуманитарных наук НИУ ВШЭ Борис Орехов – к.ф.н., доцент факультета гуманитарных наук НИУ ВШЭ Екатерина Рахилина – д.ф.н., профессор факультета гуманитарных наук НИУ ВШЭ Что такое лингвистическая ошибка? Можно ли ее вычислить? Автоматически найти? Исправить? Предупредить? Об этой и других задачах современной лингвистики расскажут сотрудники Школы лингвистики НИУ ВШЭ.


О пилотном потоке на ПМИ ФКН рассказывает Валентин Бирюков, выпускник СУНЦа и студент 1 курса образовательной программы бакалавриата Прикладная математика и информатика


Докладчик: Александр Шень В середине XX века Шеннон ввёл понятие энтропии, которое можно интуитивно описать как среднее количестве битов информации в одном значении случайной величины. Но его нельзя применить к индивидуальным объектам (скажем, к тексту романа или ДНК) - где нет ансамбля многих однородных объектов, нет и случайных величин. В середине 1960х годов разным людям (Колмогоров, Соломонов, Левин, Чейтин.) стало понятно, что можно определять количество информации (сложность) индивидуального объекта как минимальную длину программы, которая этот объект порождает (при естественных ограничениях на язык программирования). Возникла алгоритмическая теория информации, которая оказалась связанной с разными областями: от философских вопросов оснований теории вероятностей (когда мы отвергаем статистические гипотезы?) до комбинаторики (неравенства, связывающие размеры множеств и их проекций) и теории вычислимости. Я попытаюсь рассказать основные определения и какие-то из базовых результатов, а также (в зависимости от пожеланий аудитории) что-то про более современные работы.


Спикер: Александр Крайнов - Яндекс


Спикер: Дмитрий Петухов - Microsoft Certified Professional, Big Data Enthusiast, Data Dveloper @ OpenWay R&D Выступление Дмитрия Петухова было посвящено одной из последних тенденций в ИТ – облачным сервисам, предоставляющим машинное обучение как сервис (Machine Learning as a Service). В частности, подробно был рассмотрен облачный сервис предиктивной аналитики Azure Machine Learning, основные принципы и концепции, лежащие в основе Azure ML, а также возможности, которые сервис предоставляет специалистам в области data science. Часть выступления была посвящена секции «вопрос-ответ». Кроме того, прошло обсуждение, чем аналогичные сервисы могут быть полезны как небольшим стартапам, так и научным исследовательским группам. Ссылка на презентацию: Блог Дмитрия Петухова:


Спикер: Мурат Апишев - Разработчик в Группе алгоритмов антиспама компании Яндекс В ходе мастер-класса слушатели узнают о том, что такое тематическое моделирование, и о том, каковы его существующие и потенциальные применения в текстовой аналитике. Будут представлены как простейшие традиционные (LSA, LDA), так и более сложные современные модели, основанные на регуляризации. Будет произведён экскурс в возможности и интерфейсы open-source библиотеки тематического моделирования больших текстовых коллекций BigARTM. Изложение будет сопровождаться примерами, как модельными, так и реальными из проектов, с описанием программного кода и результатов. В ходе мастер-класса будет устроено мини-соревнование на kaggle. Мастер-класс по тематическому моделированию – отличная возможность освоить ещё один эффективный и гибкий инструмент машинного обучения.


Докладчик: Борис Янгель, Компания «Яндекс» Вероятностное моделирование является одним из мощнейших инструментов для специалиста по анализу данных (data scientist). К сожалению, для его использования необходимо не только уверенно владеть аппаратом теории вероятностей и математической статистики, но и знать детали работы алгоритмов приближенного байесовского вывода, что делает порог вхождения очень высоким. В этом докладе я расскажу про сравнительно молодую парадигму в машинном обучении, вероятностное программирование, задача которой — сделать всю мощь вероятностного моделирования доступной любому человеку, имеющему опыт программирования и минимальный опыт анализа данных.


Определение ближайших соседей является подзадачей многих алгоритмов анализа данных, компьютерного зрения и других прикладных областей. Самый очевидный и наивный метод поиска ближайших соседей – полный перебор. Но при больших объемах поисковой базы полный перебор становится несостоятельным из-за своей вычислительной сложности, и необходимо использовать более быстрые приближенные алгоритмы. Одним из самых распространенных подходов является построение инвертированного индекса, который делит поисковое пространство на непересекающиеся регионы и осуществляет поиск только в небольшом количестве регионов, являющихся наиболее перспективными для конкретного запроса. В докладе будут описаны две структуры данных, обобщающие идею стандартного инвертированного индекса, позволяющие осуществлять поиск ближайших соседей в базах, содержащих миллиарды векторов, за несколько миллисекунд. Практическая применимость предложенных методов подтверждена экспериментально на нескольких поисковых базах из задач компьютерного зрения.


28.04.18. Лекция в СПбАУ , Институт биоинформатики С развитием высокопроизводительных экспериментальных методов, в первую очередь основанных на определении нуклеотидных последовательностей, молекулярная биология пошла по пути, проложенном астрофизикой и физикой высоких энергий: она стала наукой, богатой данными. Вместо изучения отдельных генов и белков стало возможным рассматривать работу клетки в целом. Но все имеет цену. В массовых данных много шума. Кроме того, вместо конкретных биологических фактов, объектом исследования становятся искусственные конструкты и модели, и уровень абстракции иногда становится непривычно высоким для биологов. Используя примеры из работ последнего времени, лектор попробует обсудить проблемы и перспективы формирующейся новой науки, системной биологии, и рассказать про примеры использования современных методов анализа данных. При этом лекция будет простой во всех аспектах и не требует предварительных знаний.


Спикер: Андрей Райгородский - Московский государственный университет имени М.В. Ломоносова В 1959 году П. Эрдеш и А. Реньи начали изучать биномиальную модель случайного графа G(n, p), в которой ребра графа на n вершинах возникают взаимно независимо с одной и той же вероятностью p. За прошедшие десятилетия наука о случайных графах Эрдеша-Реньи сделалась одной из центральных дисциплин в области комбинаторики и ее приложений. Одно из наиболее естественных обобщений модели Эрдеша-Реньи состоит в следующем: берется некоторая последовательность графов Hn, и в каждом из графов Hn ребра сохраняются взаимно независимо с одной и той же вероятностью p. Возникают случайные графы Hn, p. В последнее время очень много исследований посвящено именно такому варианту модели Эрдеша-Реньи. Мы расскажем об одной последовательности графов, важной для комбинаторной геометрии и теории кодирования. Для этой последовательности графов мы рассмотрим описанный выше вариант модели Эрдеша-Реньи и обсудим различные старые и новые результаты, которые здесь удалось получить. В частности, речь пойдет о раскрасках таких случайных графов, об их кликовых числах и их числах независимости.


Лектор - В.А. Гурвич, профессор Университа Ратгерса (США) и ведущий научный сотрудник международной лаборатории теоретической информатики (ВШЭ)


Как решать сложные задачи машинного обучения, не понимая почти ничего (кроме самого главного) Сергей Бартунов - старший преподаватель департамента больших данных и информационного поиска факультета компьютерных наук НИУ ВШЭ


Ссылка на полную версию: Проектная работа у студентов первого курса Прикладной математики и информатики началась с 3-го модуля, после сдачи курсов по программированию на Python и С++. За каждым студентом был закреплен ментор-наставник из индустрии или научной среды, который ставил задачи и курировал процесс их выполнения. Каждый студент должен был выбрать один из 53 возможных проектов. Менторы предложили самые разные проекты — от биоинформатики до компьютерной лингвистики, машинного обучения и разработки игр, веб-сервисы, архивацию, задачу коммивояжера, проекты про финансы и др. В течение всей весны студенты упорно работали: предполагалось еженедельное общение с ментором. По итогам двух модулей менторы выдвинули лучших студентов на конкурс проектов, а кураторы проектного семинара отобрали 12 финалистов. В результате презентации проект “Распознавание рукописных цифр при помощи многослойной нейронной сети” занял первое место, “Игра Rally для Oculus Rift” и “Задача коммивояжера” — второе место, а “Утилита для очистки текстов от обсценной лексики” и “Web-сайт на клиентских технологиях” — третье. Призом зрительских симпатий были отмечены проекты “Социальный портрет по профилю в Instagram” и “Игра с драконом для Oculus Rift”.


Докладчик: Александр Новиков - ФКН ВШЭ/ИВМ РАН Разложение в тензорный поезд (Tensor Train, ТТ) — это обобщение SVD-разложения на тензоры (многомерные массивы). Этот подход позволяет компактно представить тензор в виде произведения факторов и совершать над ним операции посредством работы с факторами, не материализуя исходный тензор в процессе. Например, можно найти ТТ-представление поэлементного произведения двух тензоров размера 2100, заданных в виде ТТ-представления. В докладе я расскажу как ТТ-разложение может быть использовано для представления параметров моделей машинного обучения на примере полиномиальных моделей и нейронных сетей. Такая параметризация позволяет обучать модели у которых экспоненциально много виртуальных параметров, работая при этом на практике с относительно небольшими факторами ТТ-формата.


Докладчик: Константин Обухов - Data Scientist, Clever Data Статистика как наука была сформирована достаточно давно. Однако, настоящие задачи применения методов статистического анализа и математического моделирования появились с развитием инфраструктуры хранения и обработки данных. Сегодня, Data Scientist - профессия, связанная с построением различных моделей, основанных на данных, стала одной из самых востребованных должностей во всем мире. Data Science превращает объем, скорость и разнообразие Big Data в знания, которые позволяют вывести бизнес на новый уровень. Наука о данных сочетает в себе множество методов обработки, анализа и моделирования различной структурированной и неструктурированной информации. Однако, как и в любой науке, любая ошибка может привести к неверным результатам. В рамках лекции Data Scientist из CleverDATA расскажет о том, какие ошибки нельзя допускать в анализе данных, и как эти ошибки отражались на результатах конкретных исследований.


Программа мероприятия: 1. Обсуждение формата заданий. 2. Разбор списка источников и рекомендации по подготовке. 3. Разбор задач из демо-варианта (по запросу).


Лектор: Крумштейн Владимир - ведущий инженер департамента вычислительных систем КРОК. В рамках лекции будет рассказано о том, что такое облачные технологии, как они превратились из маркетингового buzz-word-а в повседневно используемые подходы. Не будет обойдён стороной вопрос о том, как собрать и запустить облако из открытых компонент. На встрече будет показано, как создаются гибкие, отказоустойчивые и открытые инфраструктуры.


Докладчик: Виктор Лемпицкий - Сколковский Институт Науки и Технологий (Сколтех) Глубокие нейросети за последние три года научились классифицировать изображения с точностью, почти сравнимой с человеческим мозгом. Но могут ли они синтезировать изображения и потеснить классические методы компьютерной графики и обработки изображений? О первых успехах в этом направлении, достигнутых исследователями за последние два года, пойдет речь в докладе.


28.04.18. Семинар в СПбАУ, Институт биоинформатики Сравнительный анализ геномных и транскриптомных данных позволяет решать традиционные задачи молекулярной биологии — анализ функции и регуляции генов - in silico, т.е. в компьютере. Лектор расскажет несколько недавних историй про то, как были сделаны и подтверждены экспериментально некоторые нетривиальные компьютерные предсказания. Первый цикл историй будет про кишечную палочку — про новый путь деградации лактозы, про превращение локального регулятора в глобальный, и про возможную связь метаболизма гексуроновых кислот с патогенностью. Вторым сюжетом будет рассказ про то, как регулируется система обезвоживание-размачивания у личинки африканского комара, которая переносит практически полное высыхание.


0:40 Иван Владимирович Аржанцев - декан факультета 13:51 Антон Сергеевич Конушин - Руководитель программы Прикладная математика и информатика 26:57 Алексей Зобнин - преподаватель Основы и методологии программирования 33:03 Евгений Юртаев - студент образовательной программы Прикладная математика и информатика 35:57 Дмитрий Марков - студент образовательной программы Прикладная математика и информатика 40:48 Константин Юрьевич Дегтярев - академический руководитель Программная инженерия 57:09 Артем Матвеенков - студент образовательной программы Программная инженерия 1:04:48 Максим Минц - студент образовательной программы Программная инженерия 1:10:51 Елена Сибирцева - студентка магистратуры Системная и программная инженерия 1:13:29 Факультет довузовской подготовки 1:16:44 Кирилл Купцов - начальник отдела по работе с абитуриентами


Консультация для участников Олимпиады НИУ ВШЭ для студентов и выпускников по направлению «Прикладная математика и информатика»


Спикер - Роман Удовиченко, руководитель группы обработки дорожной ситуации Яндекс


Wray Buntine - Professor, Monash University, Melbourne, Australia Assuming the attendee has knowledge of the Poisson, Gamma, multinomial and Dirichlet distributions, this talk will present the basic ideas and theory to understand and use the Dirichlet process and its close relatives, the Pitman-Yor process and the gamma process. We will first look at some motivating examples. Then we will look at the non-hierarchical versions of the processes, which are basically infinite parameter vectors. These have a number of handy properties and have simple, elegant marginal and posterior inference. Finally, we will look at the hierarchical versions of these processes. These are fundamentally different. To understand the hierarchical version we will briefly review some aspects of stochastic process theory and additive distributions. The hierarchical versions becomes Dirichlet and Gamma distributions (the process part disappears) but the techniques developed for the non-hierarchical process models can be borrowed to develop good algorithms, since the Dirichlet and Gamma are challenging when placed hierarchically.


Видео добавлено: