Я расскажу, почему именно сейчас Data Science оказывается одной из главных причин радикального изменения информационных технологий – а через них, в свою очередь, промышленности и жизни людей в целом. Ситуации, когда алгоритмы эффективно заменяют людей и меняют целые отрасли рассмотрены на примерах как сервисов Яндекса, так и некоторых других крупнейших мировых компаний. При этом наряду с повышением эффективности и другими достижениями возникают и неприятные побочные эффекты, способные в итоге повлиять на веками складывавшиеся в человеческом обществе институты – об этом тоже важно знать.


Докладчик: Михаил Гельфанд - Институт проблем передачи информации им. А.А. Харкевича РАН Я расскажу про основные информационные процессы, протекающие в клетке при реализации геномной программы. При этом я постараюсь избегать биохимических деталей, сосредоточившись на том, как это устроено на уровне общих принципов. Если позволят время и обстоятельства, я расскажу еще и о некоторых типичных задачах современной биоинформатики. Таким образом, доклад задумывается как crash course по молекулярной биологии для тех коллег, которые хотят понимать, чем занимаются биологи и про что разговаривают биоинформатики.


Мастер-класс компании JetBrains Особенности и возможности PyCharm для начинающих разработчиков на Python


Человечество вступило в эпоху больших данных - время, когда объем доступной для анализа информации нарастает на порядки быстрее чем вычислительные мощности. Традиционные математические методы и модели в такой ситуации становятся неприменимы. Необходимо создание новой математики , адаптированной под новые соотношения между данными и вычислительными ресурсами. Как можно хранить и обрабатывать многомерные массивы в линейных по памяти структурах? Что дает обучение нейронных сетей из триллионов триллионов нейронов и как можно осуществить его без переобучения? Можно ли обрабатывать информацию на лету , не сохраняя поступающие последовательно данные? Как оптимизировать функцию за время меньшее чем уходит на ее вычисление в одной точке? Что дает обучение по слаборазмеченным данным? И почему для решения всех перечисленных выше задач надо хорошо знать математику? Ответы на эти вопросы будут рассмотрены в докладе.


Выступят: Алексей Сидорин и Роман Чеботарев, эксперты КРОК Big Data– серия подходов, инструментов и методов обработки структурированных и неструктурированных данных больших объёмов и значительного многообразия для получения человеко-читаемых результатов, эффективных в условиях непрерывного прироста. Звучит сложно, но круто! Big Data - одна из самых ожидаемых инноваций текущего десятилетия. Сейчас она еще только на заре своего развития и очень важно понимать возможности и перспективы этих технологий. В рамках семинара мы расскажем: · про историю и перспективы развития концепции анализа больших данных · как и для чего сейчас используются технологии Big Data, приводя яркие примеры российского и международного опыта · какие существуют программные и аппаратные решения на рынке, показывая реальные системные архитектуры А возможно и покажем….


Спикер: Михаил Гельфанд - академический руководитель программы Анализ данных в биологии и медицине С развитием экспериментальных технологий изменился стиль занятий молекулярной биологией: к экспериментам с отдельными генами, белками и т.п. добавились массовые эксперименты, характеризующие клетку в целом: ее геном, работу генов, пространственную структуру ДНК, концентрацию белков, белок-белковые взаимодействия и т.п. Молекулярная биология стала наукой, богатой данными. Оказалось, что можно делать нетривиальные биологические утверждения, анализируя эти данные, и уже потом проверять их в эксперименте. Кроме того, сопоставляя получаемые описания различных организмов, мы можем существенно глубже понять их эволюцию.


Speaker: Bernhard Ganter - Technische Universität Dresden We give impressions of a field of research that was started some 30 years ago under the name of “Formal Concept Analysis.” It is a mathematical theory, based on algebraic structures such as complete lattices, with a spectrum of applications in data analysis and knowledge processing Although the theory is advanced and substantial, it finds more attention in computer science than in mathematics. Indeed, the field has some potential for supporting recent developments of structured knowledge representations. In our lecture, we introduce the very basic notions of the field, show the possibility of expressive graphical representations, discuss some applications and, eventually, demonstrate why the value of this development lies in its mathematical nature.


О пилотном потоке на ПМИ ФКН рассказывает Валентин Бирюков, выпускник СУНЦа и студент 1 курса образовательной программы бакалавриата Прикладная математика и информатика


Лектор: Григорий Бакунов - директор по распространению технологий, Яндекс Лекция для школьников в рамках Дней компьютерных наук


Спикер: Александр Крайнов - Яндекс


Докладчик: Борис Янгель, Компания «Яндекс» Вероятностное моделирование является одним из мощнейших инструментов для специалиста по анализу данных (data scientist). К сожалению, для его использования необходимо не только уверенно владеть аппаратом теории вероятностей и математической статистики, но и знать детали работы алгоритмов приближенного байесовского вывода, что делает порог вхождения очень высоким. В этом докладе я расскажу про сравнительно молодую парадигму в машинном обучении, вероятностное программирование, задача которой — сделать всю мощь вероятностного моделирования доступной любому человеку, имеющему опыт программирования и минимальный опыт анализа данных.


Спикер: Андрей Райгородский - Московский государственный университет имени М.В. Ломоносова В 1959 году П. Эрдеш и А. Реньи начали изучать биномиальную модель случайного графа G(n, p), в которой ребра графа на n вершинах возникают взаимно независимо с одной и той же вероятностью p. За прошедшие десятилетия наука о случайных графах Эрдеша-Реньи сделалась одной из центральных дисциплин в области комбинаторики и ее приложений. Одно из наиболее естественных обобщений модели Эрдеша-Реньи состоит в следующем: берется некоторая последовательность графов Hn, и в каждом из графов Hn ребра сохраняются взаимно независимо с одной и той же вероятностью p. Возникают случайные графы Hn, p. В последнее время очень много исследований посвящено именно такому варианту модели Эрдеша-Реньи. Мы расскажем об одной последовательности графов, важной для комбинаторной геометрии и теории кодирования. Для этой последовательности графов мы рассмотрим описанный выше вариант модели Эрдеша-Реньи и обсудим различные старые и новые результаты, которые здесь удалось получить. В частности, речь пойдет о раскрасках таких случайных графов, об их кликовых числах и их числах независимости.


Спикер: Дмитрий Петухов - Microsoft Certified Professional, Big Data Enthusiast, Data Dveloper @ OpenWay R&D Выступление Дмитрия Петухова было посвящено одной из последних тенденций в ИТ – облачным сервисам, предоставляющим машинное обучение как сервис (Machine Learning as a Service). В частности, подробно был рассмотрен облачный сервис предиктивной аналитики Azure Machine Learning, основные принципы и концепции, лежащие в основе Azure ML, а также возможности, которые сервис предоставляет специалистам в области data science. Часть выступления была посвящена секции «вопрос-ответ». Кроме того, прошло обсуждение, чем аналогичные сервисы могут быть полезны как небольшим стартапам, так и научным исследовательским группам. Ссылка на презентацию: Блог Дмитрия Петухова:


Докладчик: Константин Обухов - Data Scientist, Clever Data Статистика как наука была сформирована достаточно давно. Однако, настоящие задачи применения методов статистического анализа и математического моделирования появились с развитием инфраструктуры хранения и обработки данных. Сегодня, Data Scientist - профессия, связанная с построением различных моделей, основанных на данных, стала одной из самых востребованных должностей во всем мире. Data Science превращает объем, скорость и разнообразие Big Data в знания, которые позволяют вывести бизнес на новый уровень. Наука о данных сочетает в себе множество методов обработки, анализа и моделирования различной структурированной и неструктурированной информации. Однако, как и в любой науке, любая ошибка может привести к неверным результатам. В рамках лекции Data Scientist из CleverDATA расскажет о том, какие ошибки нельзя допускать в анализе данных, и как эти ошибки отражались на результатах конкретных исследований.


Ссылка на полную версию: Проектная работа у студентов первого курса Прикладной математики и информатики началась с 3-го модуля, после сдачи курсов по программированию на Python и С++. За каждым студентом был закреплен ментор-наставник из индустрии или научной среды, который ставил задачи и курировал процесс их выполнения. Каждый студент должен был выбрать один из 53 возможных проектов. Менторы предложили самые разные проекты — от биоинформатики до компьютерной лингвистики, машинного обучения и разработки игр, веб-сервисы, архивацию, задачу коммивояжера, проекты про финансы и др. В течение всей весны студенты упорно работали: предполагалось еженедельное общение с ментором. По итогам двух модулей менторы выдвинули лучших студентов на конкурс проектов, а кураторы проектного семинара отобрали 12 финалистов. В результате презентации проект “Распознавание рукописных цифр при помощи многослойной нейронной сети” занял первое место, “Игра Rally для Oculus Rift” и “Задача коммивояжера” — второе место, а “Утилита для очистки текстов от обсценной лексики” и “Web-сайт на клиентских технологиях” — третье. Призом зрительских симпатий были отмечены проекты “Социальный портрет по профилю в Instagram” и “Игра с драконом для Oculus Rift”.


Лектор: Ирина Ломазова Тема: Процессы в информационных системах: моделирование, анализ, совершенствование


Лектор: Крумштейн Владимир - ведущий инженер департамента вычислительных систем КРОК. В рамках лекции будет рассказано о том, что такое облачные технологии, как они превратились из маркетингового buzz-word-а в повседневно используемые подходы. Не будет обойдён стороной вопрос о том, как собрать и запустить облако из открытых компонент. На встрече будет показано, как создаются гибкие, отказоустойчивые и открытые инфраструктуры.


Докладчик: Frederico Wadehn - ETH Zurich (Швейцарская высшая техническая школа Цюриха). Язык выступления: English. Описание: Probabilistic graphical models together with dedicated algorithms such as belief propagation and other message passing algorithms allow a unified approach to a multitude of problems arising in signal processing, coding theory as well as in statistical inference in general. The following talk will briefly cover Bayesian networks and Markov random fields before focussing on factor graphs and related algorithms such as sum-product message passing. Various toy examples as well as an input estimation and a Bayesian inference algorithm using the factor graph description language will be shown.


Speaker: Panagiotis Karras - Skoltech Syntactic data anonymization strives to (i) ensure that an adversary cannot identify an individual’s record from published record attributes with high probability, and (ii) preserve data utility. These mutually conflicting goals can be expressed as an optimization problem with privacy as the constraint and utility as the objective function. Conventional research on k-anonymity, a popular privacy model, has resorted to generalizing data values in homogeneous groups. However, such grouping is not necessary. Instead, data values can be recast in a heterogeneous manner that allows for higher utility. Nevertheless, previous work in this direction did not define the problem in the most general terms; thus, the utility gains achieved are limited. In this paper, we propose a methodology that achieves the full potential of heterogeneity and gains higher utility. We formulate the problem as a network flow problem and develop an optimal solution therefor using Mixed Integer Programming, an O(kn2) greedy algorithm that has no time-complexity disadvantage vis-á-vis previous approaches, an O(kn2 log n) enhanced version thereof, and an O(kn3) adaptation of the Hungarian algorithm; these algorithms build a set of k perfect matchings from original to anonymized data. Our techniques can resist adversaries who may know the employed algorithms. Experiments with real-world data verify that our schemes achieve near-optimal utility (with gains of up to 41%), while they can exploit parallelism and data partitioning, gaining an efficiency advantage over simpler methods.


Бакалаврские программы факультета компьютерных наук ВШЭ


Докладчик: Евгений Тыртышников, ИВМ РАН В докладе будет рассказано о новых направлениях вычислительной линейной алгебры, которые получили развитие в ИВМ РАН за последние 20 лет. Ключевая роль в них принадлежит матрицам малого ранга, которые используются как для представления данных, в том числе многомерных матриц, так и для построения эффективных вычислительных алгоритмов. Мы обсудим различные методы представления и аппроксимации тензоров и связанные с ними математические вопросы, в том числе и открытые, и перспективы новых методов (тензорный поезд и др.), в которых все действия сводятся к матричным операциям. Новые области применений связаны с задачами оптимизации, в частности для докинга при разработке лекарственных препаратов и для идентификации параметров в моделях математической иммунологии. Получены также новые эффективные методы для специальных классов нестационарных задач, в частности для так называемого основного кинетического уравнения, и новые подходы к численному решению уравнений типа Смолуховского.


Докладчик: Елизавета Устинова, Архитектор бизнес-решений Центра отраслевой экспертизы ООО «САП СНГ» Многие аналитики относят спорт к тем областям, в которых большие данные могут действительно стать фактором, меняющим правила игры. Статистика всегда была неотъемлемой частью спортивной индустрии, но в последнее время объемы данных значительно возросли в связи с развитием технологий их сбора, а следовательно, возникла потребность в их анализе и обработке. В ходе лекции мы расскажем, как компания SAP и ее технологии помогают немецкой футбольной сборной, Национальной баскетбольной ассоциации, команде Формулы 1 и другим заказчикам из спортивной сферы извлекать максимальную пользу из нескончаемого потока цифр и делать соревнования более зрелищными.


Докладчик: Алексей Зобнин - руководитель группы в компании Яндекс, преподаватель факультета компьютерных наук. Национальный корпус русского языка () - это большая электронная коллекция текстов на русском языке, снабженных специальной лингвистической разметкой. В докладе будет рассказано об используемых технологиях обработки текстов и информационного поиска по этой коллекции, а также о некоторых прикладных задачах компьютерной лингвистики (например, о задаче снятия морфологической омонимии).


Спикер: Дмитрий Бугайченко - инженер-аналитик, ok.ru В рамках доклада Дмитрий Бугайченко рассказывает о том, какие алгоритмы анализа данных применяются в социальных сетях, о том, какие технологии для этого используется, а также немного о тех кровавых подробностях , с которыми приходится сталкиваться, масштабируя классические алгоритмы на терабайты данных.


Лектор: Андрей Соболевский Тема выступления: Как должен быть устроен научный институт по проблемам связи? презентация совместной программы ФКН ВШЭ с ИППИ РАН.


Докладчик: Илья Разенштейн (Ilya Razenshteyn) - MIT (язык доклада - русский). In the Approximate Nearest Neighbor problem (ANN), we are given a set P of n points in a d-dimensional space, and the goal is to build a data structure that, given a query point q, reports any point from P that is approximately closest to q. Locality-Sensitive Hashing (LSH) is by now a standard technique for solving the ANN problem. In my talk I will define LSH and show several constructions of good hash families. Then I will state some limitations of LSH and describe a recent line of research that provides data structures for ANN that are provably (substantially) better than what LSH could possibly give. The talk is partially based on a joint work with Alexandr Andoni (Simons Institute, previously Microsoft Research Silicon Valley). See for the paper.


Докладчик: Владимир Томко - компания Одноклассники (ok.ru) В рамках лекции игровой продюсер OK.RU Владимир Томко, в прошлом ведущий гейм-дизайнер Amber Games, расскажет о процессе создания браузерных игр, начиная с формирования концепции будущей игры и заканчивая выпуском ее в свет. Помимо этого, слушателей познакомят с тем, как проходит процесс внешнего продюсирования игр в OK.RU, из каких шагов он состоит, и что от этого получает разработчик.


Лектор: Ломоносова Светлана Вячеславовна, к.э.н - Руководитель отдела, ООО САП СНГ Лекция для школьников в рамках Дней компьютерных наук


Ссылка на краткую версию: Проектная работа у студентов первого курса Прикладной математики и информатики началась с 3-го модуля, после сдачи курсов по программированию на Python и С++. За каждым студентом был закреплен ментор-наставник из индустрии или научной среды, который ставил задачи и курировал процесс их выполнения. Каждый студент должен был выбрать один из 53 возможных проектов. Менторы предложили самые разные проекты — от биоинформатики до компьютерной лингвистики, машинного обучения и разработки игр, веб-сервисы, архивацию, задачу коммивояжера, проекты про финансы и др. В течение всей весны студенты упорно работали: предполагалось еженедельное общение с ментором. По итогам двух модулей менторы выдвинули лучших студентов на конкурс проектов, а кураторы проектного семинара отобрали 12 финалистов. В результате презентации проект “Распознавание рукописных цифр при помощи многослойной нейронной сети” занял первое место, “Игра Rally для Oculus Rift” и “Задача коммивояжера” — второе место, а “Утилита для очистки текстов от обсценной лексики” и “Web-сайт на клиентских технологиях” — третье. Призом зрительских симпатий были отмечены проекты “Социальный портрет по профилю в Instagram” и “Игра с драконом для Oculus Rift”.


Докладчик: Валерий Калягин - Заведующий Лабораторией алгоритмов и технологий анализа сетевых структур, НИУ ВШЭ Нижний Новгород В сложных сетях, с помощью различных процессов фильтрации, могут быть выделены важные сетевые структуры, несущие содержательную информацию о сети. Среди сетевых структур традиционно рассматриваются: максимальное остовное дерево, максимально отфильтрованный планарный граф, отсеченный граф, максимальные клики и максимальные независимые множества отсеченного графа и другие. В условиях статистической природы исходных данных возникает задача идентификации сетевых структур. Доклад будет посвящен недавнему развитию этой темы в рамках теории одновременной проверки многих статистических гипотез (Multiple decision statistical procedures, multiple test procedures). Такой подход позволяет разработать методы оценки статистической неопределенности сетевых структур и выделить оптимальные и устойчивые статистические процедуры идентификации. Оказывается, что сетевые структуры построенные по вероятностям совпадения знаков, оказываются предпочтительными перед структурами, построенными по классическим корреляциям Пирсона. Будут рассмотрены приложения результатов к анализу фондовых рынков.


Спикер: Артур Залевский - факультет бионженерии и биоинформатики МГУ


00:00 Иван Аржанцев - декан факультета компьютерных наук 13:43 Системная и программная инженерия - Дмитрий Александров 21:27 Программная инженерия - Сергей Зыков 37:07 Науки о данных - Алексей Незнанов 51:53 ИППИ РАН - Андрей Соболевский 1:01:58 Школа анализа данных Яндекс - Иван Пузыревский 1:12:00 Анализ данных в биологии и медицине - Михаил Гельфанд 1:26:40 Математические методы оптимизации и стохастики - Владимир Спокойный 1:40:47 Дополнительная информация о магистерских программах - Сергей Суриков


Доклад посвящен знаменитой проблеме многорукого бандита и ее применениям в веб-поиске. Проблема происходит от задачи игрока в казино, который дергает ручки игральных автоматов. Шаг игры состоит в том, что игрок выбирает ручку, получает некоторый выигрыш, который является выборкой из некоторого заранее неизвестного вероятностного распределения, ассоциированного с данной ручкой, и обновляет информацию о наблюдаемых выигрышах выбранной ручки. Цель игрока --- максимизировать математическое ожидание суммарного выигрыша, полученного игроком в течение некоторого определенного количества шагов. Для этого ему приходится выбирать баланс между эксплуатированием ручек, которые которые приносили выигрыш в прошлом, и экспериментированием с ручками, которые недостаточно хорошо были опробованы ранее. Задача коммерческой поисковой системы обычно рассматривается как задача машинного обучения: есть примеры размеченных релевантных и нерелевантных пар (запрос, документ), есть набор числовых признаков, которые могут быть автоматически посчитаны для любой такой пары, и нужно обучить модель (функцию от признаков), которая ранжирует документы по убыванию их релевантности. Однако, это лишь первое приближение к задаче. Оно не учитывает интерактивную оставляющую взаимодействия с пользователями, которые своим поведением на страницах с результатами поиска дают системе неявный фид-бек. Задача поисковой системы может быть сформулирована как задача многорукого бандита различными способами. Я рассмотрю основные имеющиеся подходы, некоторые недавние продвижения и дальнейшие актуальные задачи в этом направлении.


Докладчик: Wil van der Aalst - Eindhoven University of Technology (язык выступления - Английский) Data science is the profession of the future, because organizations that are unable to use (big) data in a smart way will not survive. It is not sufficient to focus on data storage and data analysis. The data scientist also needs to relate data to process analysis. Process mining bridges the gap between traditional model-based process analysis (e.g., simulation and other business process management techniques) and data-centric analysis techniques such as machine learning and data mining. Process mining seeks the confrontation between event data (i.e., observed behavior) and process models (hand-made or discovered automatically). This technology has become available only recently, but it can be applied to any type of operational processes (organizations and systems). Example applications include: analyzing treatment processes in hospitals, improving customer service processes in a multinational, understanding the browsing behavior of customers using a booking site, analyzing failures of a baggage handling system, and improving the user interface of an X-ray machine. All of these applications have in common that dynamic behavior needs to be related to process models. Hence, prof. Wil van der Aalst refers to it in his talk as data science in action. Process mining provides not only a bridge between data mining and business process management; it also helps to address the classical divide between business and IT. Evidence-based business process management based on process mining helps to create a common ground for business process improvement and information systems development.


Докладчик: Юрий Визильтер — ГосНИИАС Что такое «форма» данных — одномерной кривой, двумерного изображения, трехмерной фигуры, многомерного облака точек? Интуитивно понятно, что «форма» характеризует такие особенности пространственно распределенных данных, которые сохраняются при определенных типах их преобразований, либо характерны не только для данного конкретного экземпляра данных, но для некоторого класса или множества таких объектов, обладающих определенным семантическим сходством. Но как математически формализовать это понятие? Однозначного и универсального ответа на этот вопрос до сих пор нет, хотя теорий форм и основанных на них соответствующих методов обработки и анализа данных (прежде всего, изображений) создано множество. Математическая морфология (mathematical morphology, MM) была исходно предложена и развита в работах Ж. Серра, П. Марагоса и др., как теория формы, основанная на описании образов (изображений) в виде комбинации других (базовых) образов при помощи операций некоторой выбранной алгебры. В то же время Ю. П. Пытьевым был независимо предложен морфологический подход к анализу изображений (морфология Пытьева, МП), предназначенный для решения задач оценки сходства, взаимной привязки, выделения отличий между изображениями, сравнения изображений (форм) по сложности, оценки сходства/различия форм. В настоящее время оба этих алгебраических подхода, а также целый ряд геометрических подходов, рассматриваемых в рамках таких направлений, как shape matching и manifold learning, образуют современный инструментарий методов описания и анализа формы данных, которые могут быть названы в широком смысле «морфологическими». О базовых идеях, а также последних результатах в этой области пойдет речь в данном докладе.


Докладчик: Владимир Подольский - Математический институт им. В.А. Стеклова РАН / ФКН НИУ ВШЭ Мин-плюс (или тропическим) полукольцом называется множество рациональных чисел с двумя операциями: мин-плюс сложением, которая есть просто операция взятия минимума, и мин-плюс умножением, которое есть обычное сложение. Многочлены над мин-плюс полукольцом определяются по аналогии с классическими многочленами. По существу, мин-плюс многочлен задает кусочно-линейную функцию от своих переменных. Корнем многочлена называется точка негладкости этой функции. В этом докладе мы рассмотрим алгоритмические задачи, связанные с мин-плюс многочленами. Более конкретно, нас будет интересовать разрешимость систем линейных мин-плюс многочленов. Эта задача оказывается полиномиально эквивалентной задаче об определении победителя в так называемых циклических играх (mean payoff games), известной задаче, лежащей в пересечении сложностных классов NP и coNP. Второй результат, который планируется обсудить в ходе доклада, это аналог теоремы Гильберта о нулях для мин-плюс алгебры. Доклад основан на совместных работах с Д.Ю. Григорьевым.


Докладчик: Дмитрий Бугайченко - ведущий разработчик рекомендательных систем в ok.ru (Одноклассники) В рамках лекции Дмитрий рассказывает о разнообразных задачах, связанных с анализом текстов на естественных языках, о том как менялись подходы к обработке текстов, о текущем состоянии области. Кроме того на ИТ лектории разобран стек задач и технологий анализа текста, используемый в Одноклассниках и других проектах Mail.ru.


Докладчик: Александр Подхалюзин, JetBrains Докладчик: Александр Подхалюзин с 2008 года работает в компании JetBrains. В настоящее время руководит проектом Scala plugin for IntelliJ IDEA. С 2012 года преподаёт язык Scala в Санкт-Петербургском Академическом университете. В своей лекции Александр расскажет о базовом синтаксисе языка Scala, классах и множественном наследовании, немного про функции и паттерн матчинг. Кроме того, будет рассмотрено самое главное и неоднозначное, что есть в языке, – implicit conversions. Цель лекции заключается не в том, чтобы научить языку Scala, так как в столь краткое время без практических заданий освоить язык невозможно. Настоящая цель – показать, что все это на самом деле несложно и браться за изучение можно и нужно.


Докладчик: Сергей Объедков, НИУ ВШЭ В традиционной постановке задачи обучения с учителем мы располагаем набором данных, разбитым учителем на несколько классов, и стремимся реконструировать принцип, лежащий в основе этого разбиения. Что, если данных нет, но есть сам учитель, готовый отвечать на наши вопросы? Какие вопросы и в какой последовательности нужно задавать, чтобы как можно быстрее обучиться интересующему нас понятию? Мы рассмотрим базовые принципы обучения с запросами и разберем некоторые простые алгоритмы, работающие в такой модели. Подробнее остановимся на задаче обучения формуле Хорна, для которой существует полиномиальный алгоритм обучения с запросами. Эта задача тесно связана с задачей вычисления базиса импликативных зависимостей, выполняющихся в данных, которая изучается, в частности, в анализе формальных понятий. Можно ли превратить полиномиальный алгоритм обучения с запросами в полиномиальный алгоритм обучения по данным, эффективно имитируя учителя? Ответ пока неизвестен.


Лектор: Сергей Пронин - департамент Программной инженерии ФКН ВШЭ Лекция для школьников в рамках Дней компьютерных наук


Спикер: Игнат Колсениченко - Яндекс, iBinom


This talk is for beginners in the serious study of computer science. Behind its presentation lies the attitude that software, including programmes, denote mathematical objects. Through three examples I provide a glimpse into a universe of domains for which software is developed every day but for which, in most instances, there are no formal, i.e., mathematical understanding. The three examples are: road transport and platooning systems, oil/gas pipeline systems, and stock exchange sell offer/buy bid matching. The objective of this talk is to show you what it means to develop software using mathematics, albeit it new kind of mathematics, not differential equations, nor integrals, nor statistics, etc., but mathematical logic and abstract algebra, so that software can be shown correct, i.e., no bugs, no blue screen, and to met customers expectations!


Лектор: Иван Пузыревский Тема: Алгоритмы для анализа потоков данных


Тема выступления: Моделирование и анализ вычислительных процессов Докладчик: Ростислав Яворский - доцент департамента анализа данных и искусственного интеллекта ФКН Машины Тьюринга, Поста, Минского, алгорифмы Маркова, рекурсивные функции Клини были придуманы в первой половине двадцатого века в результате попыток формализовать понятие алгоритма. Эти математические модели до сих пор успешно применяются для решения задач разрешимости и алгоритмической сложности, но бесполезны для моделирования поведения сетевых протоколов или компонентов операционной системы. В рамках доклада будут представлены некоторые современные подходы к моделированию вычислений, которые используются в индустрии при разработке сложных информационных систем.


В докладе планируется затронуть следующие темы: - решетки замкнутых множеств в математике 20-го века; сообщество специалистов: конференции и школы; - основные определения: решетки, соответствия Галуа, понятия, импликации, базисы импликаций; - функциональные зависимости в базах данных и импликации на признаках; - вычислительные задачи и алгоритмы Анализа Формальных Понятий; - решетки понятий и ассоциативные правила в Data Mining; - за пределами бинарных данных: решетки замкнутых описаний на основе графов, последовательностей, кортежей числовых интервалов.


Докладчик: Юрий Нестеров, CORE (Брюссель) и ФКН НИУ ВШЭ Теория оптимизации, возникшая на стыке математики и инженерных дисциплин, поневоле наследует противоречия между этими классическими областями знаний. Только правильная расстановка приоритетов при выборе и определении основных понятий (размер данных, размерность и т. д.) позволяет построить математически строгую теорию методов оптимизации, интересную как математикам, так и инженерам. Именно о таких приоритетах пойдет речь в докладе. С другой стороны, есть все основания утверждать, что устройство окружающей нас природы и общества основано на мощнейших оптимизационных принципах – именно тех, которые и нужны для решения задач сверхбольшого размера. Понимание и математическое обоснование этих принципов, по–видимому, и будет основным стимулом для развития теории и методов оптимизации в ближайшее время.


Торжественное вручение диплома почётного профессора ВШЭ и лекция профессора Технического университета Эйндховена (Нидерланды) Вила ван дер Аалста


Докладчик: Софья Кисельгоф - Международная научная лаборатория анализа и выбора решений НИУ ВШЭ На практике часто возникает задача распределения объектов или людей в пары друг с другом, например, распределение сотрудников по вакансиям, формирование комитетов, распределение абитуриентов по вузам и др. Доклад посвящен теории и практике построения механизмов такого распределения с учетом предпочтений индивидов.