cuda АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс...

19
CUDA ® АЛЬМАНАХ СЕНТЯБРЬ 2016

Upload: others

Post on 24-Jul-2020

14 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA® АЛЬМАНАХСЕНТЯБРЬ 2016

Page 2: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 2

СОДЕРЖАНИЕ

НОВОСТИ NVIDIA CUDA

Врачи используют графические процессоры для предотвращения болезней

Виртуальная реальность - новый шаг на пути к полетам в космос

Технологии глубокого обучения ускорят поиск внеземной жизни

Поиск лечения от зависимости и депрессий

ВЕБИНАРЫ НА АНГЛИЙСКОМ ЯЗЫКЕ

НАУЧНЫЕ РАБОТЫ С ИСПОЛЬЗОВАНИЕМ ВЫЧИСЛЕНИЙ НА CUDA

Успехи iBinom в использовании deep learning на видеокартах NVIDIA для скоринга патогенности точечных мутаций

Параллельный алгоритм поиска максимума целевой функции методом динамического программирования с помощью технологии CUDA

ПОЛЕЗНЫЕ РЕСУРСЫ ПО CUDA

КОНТАКТЫ

3

6

10

12

13

14

14

16

18

19

Page 3: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 3

ВРАЧИ ИСПОЛЬЗУЮТ ГРАФИЧЕСКИЕ ПРОЦЕССОРЫ ДЛЯ ПРЕДОТВРАЩЕНИЯ БОЛЕЗНЕЙ

Технология глубокого обучения помогает врачам спасать жизни людей благодаря выявлению пациентов с факторами высокого риска прежде, чем болезнь будет диагностирована.

Исследователи из нью-йоркской Школы медицины Икана при больнице Маунт-Синай используют технологию глубокого обучения, подраздел искусственного интеллекта, для анализа электронных медицинских карт и выявления пациентов, имеющих максимальные риски развития серьезного заболевания в течение года.

Чтобы натренировать экспериментальную модель нейросети под названием Deep Patient, ученые использовали данные из медицинских карт, накопившихся за 12 лет - их общее число составило 700000. Во время тестирования нейронная сеть показала, что способна прогнозировать десятки заболеваний, включая сердечную недостаточность, некоторые виды онкологических заболеваний и диабет.

«Если говорить о большинстве заболеваний, то профилактика намного проще, чем лечение, - сказал Джоэль Т. Дадли (Joel T. Dudley), автор недавней статьи в Nature Scientific Reports, которая описывает исследование, проведенное в больнице Маунт-Синай. - Это исследование может оказать огромное влияние на здоровье человечества».

НОВОСТИ NVIDIA CUDA

Page 4: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 4

«Электронные медицинские карты используются для выставления счетов, а не как инструмент для врачей», - сказал Дадли.

Исследователи стремятся использовать эти данные и алгоритмы глубокого обучения для развития точной медицины, персонализированного подхода к профилактике и лечению пациентов.

Нейронная сеть была натренирована на тысячах медицинских записей с использованием графических ускорителей NVIDIA Tesla K80 и модели программирования CUDA. Они протестировали свои модели на 75000 пациентов.

Прогнозирование нескольких заболеваний вместо одного

Исследователи из Маунт-Синай не первые, кто использует электронные медицинские карты и технологию глубокого обучения для прогнозирования рисков развития заболевания. (Читайте “Искусственный интеллект может спрогнозировать сердечную недостаточность еще до диагностирования”). Но в отличие от более ранних исследований, которые были направлены на выявление одного заболевания, их модель нейронной сети способна выявить почти 80 различных видов болезней. Они смогли этого добиться благодаря использованию нового метода представления медицинских данных для компьютерного анализа.

Доктор просматривает электронную медицинскую карту пациента. Изображение предоставлено Министерством сельского хозяйства США.

Потенциал электронных медицинских карт

По словам Дадли, доцента медицинских наук из Маунт-Синай, благодаря заблаговременному предупреждению, врачи и пациенты получают ценное время, чтобы предпринять действия, способные предотвратить болезнь или отсрочить ее наступление. Врач, к примеру, может прописать пациенту необходимое лекарственное средство или перевести его на специальную диету.

По мнению Дадли, нейросеть Deep Patient, получившая ускорение на GPU, также способна сократить расходы на здравоохранение. Сосредоточив свое внимание на профилактике заболеваний у пациентов с высокими факторами риска, медицинские учреждения могут в дальнейшем избежать расходов на более дорогостоящее лечение.

На создание Deep Patient исследователей толкнуло недовольство электронными медицинскими картами. Они содержат в себе огромный объем информации о пациентах: результаты анализов, записи о проведенных операциях, назначения лекарств, анамнез и многое другое. Однако на сегодняшний день врачи не имеют возможности использовать эти данные в целях улучшения диагностики или терапии.

Page 5: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 5

«Раньше разработчики создавали единичные репрезентации данных для каждой отдельной болезни, - рассказал Дадли. - Но у пациентов редко наблюдается только одна болезнь, обычно их несколько».

Вместо этого исследователи разработали такую репрезентацию данных, которая включает в себя всю историю болезни пациента, как рассказал нам Риккардо Миотти (Riccardo Miotto), специалист по обработке и анализу данных в Маунт-Синай и один из главных авторов статьи.

Однако, прежде чем врачи смогут использовать Deep Patient, чтобы помогать пациентам, потребуется еще много работы. Чтобы добиться еще более точных прогнозов, команда ученых из Маунт-Синай планирует добавить в нейросеть еще больше данных, например, генетическую информацию и семейный анамнез.

Больше данных - более точные диагнозы

Дадли рассказал, что надеется использовать данные из электронных медицинских карт для создания инструмента, который врачи смогут использовать в целях повышения качества диагностики и оказания терапии.

«Одной из трудностей является то, что у врача остается меньше времени на общение с пациентом, а объем информации в электронной медицинской карте растет», - пояснил он.

Так как все больше данных о состоянии пациента поступает с нательных медицинских датчиков, «врачи просто перегружены информацией», по его словам. «Мы хотим построить систему, которая будет использовать все доступные данные, чтобы прогнозировать состояние здоровья пациентов и помогать докторам находить новые подходы для лечения».

Page 6: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 6

ВИРТУАЛЬНАЯ РЕАЛЬНОСТЬ - НОВЫЙ ШАГ НА ПУТИ К ПОЛЕТАМ В КОСМОСNASA приступает к 15-летнему этапу подготовки полетов на Марс. И виртуальная реальность сыграет в этом ключевую роль.

NASA использует GPU-технологии NVIDIA, игровой движок Unreal Engine 4, VR-технологии, физические модели и макеты, нательные гаджеты и систему трекинга для создания проекта, который космическое агентство США называет «Системой смешанной реальности». Она станет невероятно реалистичным и иммерсивным средством для проведения тренировок астронавтов, и ее стоимость будет значительно ниже традиционных испытаний в полевых условиях.

Фрэнк Дельгадо (Frank Delgado) и Мэттью Нойес (Matthew Noyes) из Центра космических исследований имени Джонсона Линдона в NASA преследуют цель создать недорогую, масштабируемую платформу, которая ляжет в основу «внеземных» симуляций.

Смешанная реальность: NASA объединяет реальный и виртуальные миры для тренировки астронавтов. На снимке: виртуальный вид изнутри модуля Международной космической станции «Спокойствие».

«Смешанная реальность сочетает в себе реальный и виртуальные миры и берет от них только лучшее, - объясняет Нойес. - Уже сейчас VR-система HTC Vive способна зрительно перенести вас в любое место во вселенной. Наша цель - усовершенствовать воздействие на другие органы чувств человека, чтобы пользователь забыл, что у него на голове шлем виртуальной реальности, и ощущал себя, как в реальной комнате.

Как NASA стала пионером в области виртуальной реальности

В середине 80-х годов Исследовательский центр Эймса в NASA разработал одну из первых функциональных VR-систем в мире.

«А затем частные компании упростили ее, довели до совершенства и добавили свои инновации, - рассказывает Нойес, сравнивая развитие VR-технологий усилиями частных компаний с развитием коммерческих полетов в космос. - И теперь NASA может реинтегрировать современные технологии в свои системы».

Page 7: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 7

Здесь вы можете увидеть примеры шлемов виртуальной реальности и цифровых перчаток, созданных в восьмидесятые в Исследовательском центре Эймса…

Следующим шагом, по словам Нойеса, является воссоздание ощущения невесомости. Система разгрузки гравитации под названием ARGOS (Active Response Gravity Offload System), разработанная в Космическом центре имени Линдона Джонсона, - идеальный кандидат для этой цели.

«ARGOS, - объясняет Нойес, - представляет собой роботизированный кран, который принимает на себя вес всего вашего тела или некоторых его частей. В результате мы получаем имитацию пониженной гравитации, которая наблюдается на Марсе, Луне и Международной космической станции.

…Удивительно, насколько современные шлемы виртуальной реальности оказались похожи на свои ранние прототипы.

По мнению Нойеса, подобная система позволит астронавтам практиковаться в передвижении за пределами космической станции или на каменистых, неровных поверхностях космических тел. Они смогут даже тренироваться бурить горные породы для получения минералогических образцов на астероиде или другой планете.

Подобие игры

По словам Нойеса, чтобы реализовать это, NASA необходимо визуализировать тренировочные сценарии в режиме реального времени и добиться фотореалистичного качества графики, корректной физики и многочисленных функциональных возможностей.

Именно здесь в игру вступают GPU-технологии NVIDIA, такие как VRWorks, и игровые движки, например, Unreal Engine 4. Такие технологии, как VR SLI и Multi Res Shading, позволяют добиться невероятно высокой производительности, качества картинки и уровня взаимодействия.

Применение этих технологий имеет успех, так как тренировки с помощью смешанной реальности сильно напоминают игру. «В обоих случаях необходимо выполнять разные задачи при наличии определенных ограничений, визуализировать мир вокруг в 3D и взаимодействовать с окружением и, возможно, другими людьми в процессе», - говорит Нойес.

Page 8: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 8

Внутри Международной космической станции

NASA создала серию технологических демо-роликов, чтобы продемонстрировать возможности смешанной реальности. С помощью высокопроизводительных графических процессоров NVIDIA NASA смогла разработать проект смешанной реальности, который в буквальном смысле уносит человека с Земли. Проект виртуального пребывания на МКС воссоздает модули, которые часто посещают астронавты, интересные системы, такие как беговая дорожка COLBERT, названная в честь комика Стивена Колберта, и даже вид из окна модуля «Купол». Виртуальные астронавты также смогут увидеть специальный тренажер ARED, на котором тренируются астронавты. Они выполняют упражнения на сопротивление, благодаря вакуумным цилиндрам, которыми оснащен тренажер.

За пределами Земли: NASA воссоздала в виртуальной реальности вид из окна Международной космической станции.

Виртуальный вид изнутри модуля Международной космической станции «Дестини».

Page 9: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 9

Эти окружения являются не просто изображениями, они интерактивны. NVIDIA PhysX лежит в основе физического взаимодействия пользователя с виртуальными объектами и обеспечивает более реалистичную анимацию. «Мы показали наш проект астронавтам, которые побывали на космической станции. Они сказали, что поведение объектов в условиях микрогравитации, особенно при столкновениях, очень реалистично», - рассказывает Нойес.

Элементы реального мира

В своем эксперименте NASA пошла еще дальше, используя напечатанные на 3D принтере макеты инструментов и систем управления. Затем NASA интегрировала в эти физические макеты графические движки нового поколения, тесно сотрудничая с NVIDIA для оптимизации производительности.

К примеру, NASA создала еще один проект смешанной реальности, воспроизводящий не только визуальные, но и физические ощущения от поездки на луноходе. Водители могут управлять луноходом с помощью джойстика, который присутствует как в реальности, так и в виртуальном пространстве. «Ландшафт был создан, по большей части, на основе реальных картографических данных, полученных NASA во время посадки на Луну «Аполлона-14».

NASA создала симуляцию, воспроизводящую не только визуальные, но и физические ощущения от поездки на луноходе.

Некоторые детали этой сцены на Луне включают модели Нила Армстронга, Базза Олдрина и лунного модуля из демо места посадки лунного модуля «Аполлон-11», разработанного NVIDIA.

Первые шаги долгого путешествия

Подобные технологии чрезвычайно важны в самом начале долгого путешествия к Марсу.

NASA продолжит не только заниматься научными исследованиями на борту МКС, но и развивать коммерческие системы доставки грузов на околоземную орбиту, работать над завершением проекта по строительству космического корабля «Орион» и сверхтяжелой ракеты-носителя Space Launch System, которые позволят человеку заглянуть в Солнечную систему дальше, чем когда-либо.

Благодаря технологиям NVIDIA, следующие шаги в этом долгом путешествии, которое закончится высадкой человека на Марсе, начнутся с тренировок астронавтов в невероятно реалистичных и иммерсивных окружениях смешанной реальности.

Page 10: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 10

ТЕХНОЛОГИИ ГЛУБОКОГО ОБУЧЕНИЯ УСКОРЯТ ПОИСК ВНЕЗЕМНОЙ ЖИЗНИ

Система глубокого обучения, разработанная астрономами из Университетского колледжа Лондона, обрабатывает данные, полученные с телескопов. Она была натренирована с использованием данных об удаленных солнечных системах таким образом, чтобы определять планеты, которые потенциально способны поддерживать жизнь.

“Мы хотим понимать, какие планеты стоит изучать в дальнейшем, а какие - нет. И мы хотим автоматизировать этот процесс распознавания», - объяснил Инго Вальдманн (Ingo Waldmann), исследователь из Университетского колледжа Лондона, который руководит группой разработчиков.

Он назвал программу, основанную на алгоритмах глубокого обучения с ускорением на GPU, RobERt, что расшифровывается как «роботизированное распознавание экзопланет» (Robotic Exoplanet Recognition). Экзопланеты - это планеты, расположенные за пределами нашей Солнечной системы. Глубокое обучение, направление в области искусственного интеллекта, - это способ обучения компьютеров выполнять такие задачи, как распознавание изображений или речи, почти так же точно, как человек.

Как алгоритмы глубокого обучения распознают признаки жизни в космосе

Используя данные, полученные с телескопов, RobERt изучает световые лучи, проходящие сквозь атмосферу экзопланет, и ищет признаки наличия метана, углекислого и других газов, которые свидетельствуют о биологической активности на планете.

Почему именно световые лучи? Различные типы молекул поглощают и излучают свет на определенных длинах волн, поэтому каждая молекула имеет свой «отпечаток» в световом спектре. По этому отпечатку, или шаблону, астрономы способны понять, какие газы присутствуют в атмосфере.

«Ученые хорошо умеют находить и определять эти шаблоны, но это отнимает очень много времени, -рассказал Вальдманн. - То, на что у нас обычно уходили дни или недели, RobERt делает за считанные секунды».

Page 11: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 11

Вальдманн и его команда натренировали свою глубокую нейронную сеть, заложив в нее более 85 000 смоделированных спектров, охватывающих пять различных типов атмосфер экзопланет. Для этого они использовали язык Python с поддержкой CUDA, графические процессоры NVIDIA Tesla K80 и ускорители Tesla K40. Каждый спектр содержал «отпечаток» определенного газа.

Искусственный интеллект помогает изучать далекие солнечные системы. . .

Исследователи использовали RobERt для обработки данных с космического телескопа «Хаббл». В ближайшее десятилетие, по мнению Вальдманна, с запуском более мощных телескопов и амбициозных миссий ученые столкнутся с по-настоящему сложной задачей. Первый из них, инфракрасный космический телескоп имени Джеймса Уэбба, предназначенный для наблюдения за первыми галактиками Вселенной, планируется запустить на орбиту в 2018 году.

«Объем данных, которые мы получим, будет просто колоссальным, - сказал Вальдманн. - RobERt сыграет неоценимую роль и поможет нам проанализировать эти данные и узнать, что представляют собой удаленные миры».

Цель Вальдманна - создать автоматизированную систему, которая будет получать данные с телескопа и проводить анализ газов, молекул, климата и химического состава планет. Ученые уже знают, что наша собственная Солнечная система не типична для нашей галактики. В ее составе можно найти все, начиная от заледеневших миров и заканчивая огромными раскаленными планетами, такими как Юпитер.

. . . Изучение нашей Солнечной системы

Обладая подобными данными, у ученых есть шанс составить более точное представление о том, как были сформированы удаленные солнечные системы. По словам Вальдманна, возможность взглянуть на статистические пробы различных солнечных систем прольет свет на то, как появилась наша Солнечная система, процесс, который до сих пор плохо изучен.

«До 1995 года мы знали о существовании только одной солнечной системы, нашей. Теперь мы знаем о более 2500 систем, - рассказал Вальдманн. - Учитывая, сколько всего еще нам предстоит узнать, мы все больше будем нуждаться в таких системах с искусственным интеллектом, как RobERt, чтобы поместить Солнечную систему в более широкий контекст нашей галактики».

Kepler-186f стала первой скалистой планетой, найденной в обитаемой зоне звезды. Изображение: NASA

Page 12: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 12

ПОИСК ЛЕЧЕНИЯ ОТ ЗАВИСИМОСТИ И ДЕПРЕССИЙКоманда под руководством исследователей из Корнелльского университета использует суперкомпьютер Titan в Национальной лаборатории Оук-Ридж для изучения механизмов натрий-зависимых транспортеров.

В лаборатории Харела Вайнштайна в Медицинском колледже Вейл Корнелл при Корнелльском университете построили сложные трехмерные молекулярные модели особого вида транспортеров нейромедиаторов под названием нейромедиатор-натрий симпортеры (NSS) и смоделировали их поведение и взаимодействие с помощью суперкомпьютера, оснащенного ускорителями NVIDIA Tesla. Эти модели, возможно, помогут разработать стратегии лечения таких поведенческих расстройств, как зависимость, депрессия и мутации, которые вызваны нарушениями NSS-протеинов.

Чтобы максимально эффективно использовать время работы на Titan, исследователи решили воспользоваться приложением для молекулярной динамики ACEMD, которое является высокооптимизированным программным пакетом молекулярной динамики, разработанным для ускорения на GPU.

«Titan дал нам возможность работать с большим количеством GPU на протяжении длительного времени. Без ускорения на графических процессорах наша работа была бы невозможной», - рассказал Вайнштайн.

Узнайте больше >>

Page 13: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 13

ВЕБИНАРЫ НА АНГЛИЙСКОМ ЯЗЫКЕ Последние записи на английском языке:

Building Better Autonomous Machines with NVIDIA® Jetson™

Catch Up On CUDA by Acceleware

Real time, Low Latency Feature Tracking with ArrayFire

More Science, Less Programming with OpenACC

Deep Learning Courses

Page 14: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 14

УСПЕХИ IBINOM В ИСПОЛЬЗОВАНИИ DEEP LEARNING НА ВИДЕОКАРТАХ NVIDIA ДЛЯ СКОРИНГА ПАТОГЕННОСТИ ТОЧЕЧНЫХ МУТАЦИЙ

Андрей Афанасьев, CEO компании iBinom, верит, что deep learning может помочь врачам находить причины наследственных заболеваний. Его вера основывается на успехах нейронных сетей, разработанных компанией, в классификации мутаций, возникающих в белок-кодирующей части генома человека и ответственных за проявления большинства наследственных заболеваний. Сегодня нейронные сети iBinom демонстрируют точность в классификации отдельных мутаций от 92% до 97% на различных наборах данных, и похоже что это – не предел.

Давайте посмотрим, как связаны deep learning, биоинформатика, наследственные заболевания и персонализированная медицина. Человеческий геном содержит гигантское количество информации, кодирующей развитие и функционирование нашего тела. По своей сути, геном – это совокупность очень длинных молекул ДНК, которые представляют собой последовательности четырех различных нуклеотидов (A, C, T и G), постоянно изменяющихся, в основном путем случайной замены одного нуклеотида на другой. Такие замены называются точечными мутациями (SNP). Именно эти замены делают каждого человека уникальным. Относительно небольшая часть генома, так называемый экзом, кодирует все белки – молекулярные машинки, выполняющие большую часть работы по поддержанию нашего существования. И по многим различным причинам, именно мутации в экзоме чаще всего приводят к заболеваниям. Именно такие мутации называются патогенными, и их надо отличать от мутаций, которые не вызывают никаких заболеваний – такие мутации называются нейтральными.

За последние пятнадцать лет, благодаря развитию технологий секвенирования, персональная геномика уверенно вошла в клиническую практику развитых стран. Одновременно с этим развивались системы компьютерного предсказания патогенности точечных мутаций – все началось с таких заслуженных программ для скоринга как PolyPhen и SIFT, а пришло к перспективному пакету FATHMM и множеству мета-скоров, комбинирующих различным образом другие программы (в т.ч. и PolyPhen, и SIFT, и FATHMM).

Однако, в предсказании патогенности мутаций есть два важных недостаточно исследованных момента: во-первых, это относительно небольшое количество хорошо охарактеризованных SNP, которые используются для тренировки и тестирования программ для скоринга, а во-вторых, – высокая вероятность отсутствия необходимой информации для скоринга отдельных SNP. Существующие наборы SNP содержат преимущественно мутации в интенсивно изучаемых белках и in vitro модельных системах, что сильно затрудняет обобщение результатов на все белки и дальнейший скоринг SNP. С другой стороны, комбинация множества различных отдельных фичей, используемых для скоринга SNP, приводит к сложному нелинейному и нерегулярному пространству решений, что не позволяет использовать большинство стандартных подходов к импутации пропущенных данных и, опять же, затрудняет обобщение.

В компании iBinom увидели отличную возможность для использования подходов deep learning в решении этих задач, как для обучения с учителем, так и для самообучения, поскольку, согласно теореме Цыбенко (универсальной теореме аппроксимации) искусственная нейронная сеть прямой связи с одним скрытым слоем может аппроксимировать любую непрерывную функцию многих переменных с любой точностью.

НАУЧНЫЕ РАБОТЫ С ИСПОЛЬЗОВАНИЕМ ВЫЧИСЛЕНИЙ НА CUDA

Page 15: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 15

Перед iBinom стояла задача классификации патогенности SNP по значениям существующих на данных момент скоров. Решение задачи затруднялось следующими проблемами:

1) Сравнительно небольшая обучающая выборка ( ~90к примеров)

2) Дисбаланс классов в обучающей выборке (1:3)

3) Большое количество пропущенных значений (только у ~10к записей есть все значения)

4) Нелинейная (и не всегда монотонная) взаимосвязь между фичами, что, как было сказано, затрудняет использование стандартных подходов к импутации данных.

Были выбраны три подхода, уже продемонстрировавшие успех в других областях науки:

1) многослойные перцептроны с активацией усеченным линейным преобразованием и тренировкой с дропаутом на скрытых слоях (при этом тренировка шла на данных с пропущенными значениями фичей, что соответствует большинству реальных случаев)

2) сужающийся глубокий помехоустойчивый автокодировщик с инъекцией шума и предварительным самообучением, в совокупности с

3) глубоким многослойным перцептроном, который использовался на выходе либо с внешнего слоя декодирующей части, либо с самого узкого слоя кодирующей.

Для подбора гиперпараметров архитектуры сетей (количество слоев, нейронов, режимы обучения и пр.) использовался генетический алгоритм, для реализации которого в iBinom был написан собственный пакет genetic для PyPI. Сами нейросети реализовались с помощью пакетов lasagne и Theano. Готовые реализации были опубликованы в открытом доступе в виде пакета basicnnets в PyPI под лицензией MIT. Обучение проходило на видеокарте NVIDIA Titan X. Все обучение заняло около месяца: генетический алгоритм искал подходящие гипер-параметры одну неделю, затем оптимальная сеть тренировалась один день, автоэнкодеры подбирались три недели, а тренировка оптимального заняла еще пять дней.

В результате был получен существенный прирост точности в классификации SNP, причем как для записей с полной, так и, что немаловажно, с неполной информацией. Большинство сегодняшних программ для скоринга вообще не умеют работать с SNP с неполной информацией, что позволяет смотреть на результаты использования нейросетей с большим оптимизмом. Так, для iBinom score, средняя точность на общепризнанной выборке VariBench составила 92% против 86% у самого точного из существующих на сегодняшний день скоров MetaLR от dbNSFP.

Вдохновленные этими результатами, в iBinom начали разрабатывать программу для предсказания физиологических эффектов отдельных мутаций и их комбинаций (с учетом эпистатического взаимодействия). Для этого сейчас собирается база данных, содержащую информацию о белок-белковых взаимодействиях, доменной структуре белков, мутагенезе, тканеспецифическом сплайсинге, метаболических сигнальных путях и многом другом. В iBinom верят, что объединив эти данные, они смогут извлекать информацию, представляющую ценность для медицинских генетиков, хотя и предвидят определенные трудности как со сбором необходимой информации, так и с извлечением фичей. Однако хорошие новости состоят в том, что последние разработки в области сверточных нейронных сетей и новые разработки NVIDIA существенно упрощают им работу. Прямо сейчас в iBinom проверяют данный подход.

Page 16: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 16

ПАРАЛЛЕЛЬНЫЙ АЛГОРИТМ ПОИСКА МАКСИМУМА ЦЕЛЕВОЙ ФУНКЦИИ МЕТОДОМ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ С ПОМОЩЬЮ ТЕХНОЛОГИИ CUDA

Середин Э.Н.

Подробнее

До сих пор актуальной является задача разработки алгоритмов поиска глобального максимума целевой функции. Наиболее известными являются алгоритмы, построенные на основе градиентных методов, алгоритмов случайного поиска, алгоритмов имитации отжига, генетических и эволюционных алгоритмов. При исследовании и тестировании ранее разработанного алгоритма интерактивного выделения линейных объектов на аэрофотоснимках и космических изображениях необходимо было подобрать алгоритм поиска глобального максимума целевой функции, который смог бы эффективно заменить переборный алгоритм.

Суть алгоритма выделения линейных объектов состоит в следующем: пользователь в интерактивном режиме выделяет два пиксела a и b , которые ограничивают участок линейного объекта и соединяются прямой линией. Далее отрезок ],[ ba разбивается на заданное число узлов, в которых затем строятся направляющие, перпендикулярные данному отрезку. С учетом ограничения угла автоматически среди всех возможных выбирается та ломаная, которая в наибольшей мере заполнена градиентом изображения, ортогональным к звеньям этой ломаной. Найденная ломаная принимается в качестве приближения участка линейного объекта. На рис. 1 показан пример нахождения оптимального решения с учетом ограничения максимального допустимого угла между соседними ломаными линиями.

Рис. 1. Пример работы алгоритма

Большинство из известных алгоритмов поиска глобального максимума целевой функции оказались непригодны для использования из-за ряда наложенных требований и ограничений (количество операций, объем используемой памяти, быстродействие, ограничение угла). Например, тестирование реализации алгоритма полного перебора всех возможных вариантов на процессоре показало абсолютную ее неприменимость на практике из-за очень большого времени вычислений. Поэтому было решено разработать новый алгоритм поиска глобального максимума целевой функции, который учитывал бы все предъявляемые требования и ограничения.

В данной работе предлагается параллельный алгоритм поиска максимума целевой функции методом динамического программирования, который специально был разработан для использования технологии программирования видеокарт CUDA. Изначально алгоритм разрабатывался для ускорения работы алгоритма интерактивного выделения линейных объектов на аэрофотоснимках и космических изображениях, но может быть использован в таком виде или модифицированном и в других задачах, особенно там, где необходим перебор всех вариантов с наложенными ограничениями на получаемое решение.

Page 17: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 17

Предложенные различные подходы построения алгоритма позволили не только сократить общее число необходимых операций, но и сократить объемы копирования и одновременного использования памяти на каждом из шагов алгоритма. Также к преимуществам алгоритма можно отнести то, что он изначально был спроектирован для хорошей масштабируемости расчетов, которая ограничивается только количеством доступных вычислительных устройств. Запуск алгоритма на более производительных видеокартах даст возможность использования большего количества точек разбиения и точек на направляющих при сохранении времени вычислений на приемлемом уровне для практической работы. Полученные данные тестирования показали применимость данного алгоритма для практической работы при использовании версии для видеокарты.

Page 18: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 18

ПОЛЕЗНЫЕ РЕСУРСЫ ПО CUDAГруппа вконтакте: www.vk.com/nvidiacuda

Новый каталог с более 400 приложениями, ускоряемыми на GPU можно скачать по ссылке.

Материалы GPU Technology Conference 2015 доступны по ссылке

Форум Разработчиков NVIDIAприсоединяйтесь к Форуму CUDA-разработчиков, делитесь своим опытом и узнавайтемного нового. http://devtalk.nvidia.com/

Документация по CUDAСо списком документации по CUDA можно ознакомиться здесь.

Обучение онлайнUdacity | Coursera | Курс на русском языке

Библиотеки с поддержкой GPU ускоренияСписок библиотек с поддержкой GPU ускорения от NVIDIA и партнеров.

GPU Тест-Драйв Хотите бесплатно протестировать Tesla? Зарегистрируйтесь здесь.

Ускоряйте научные приложения с OpenACCПротестируйте компилятор PGI OpenACC бесплатно в течение месяца. Подробнее.

Книги, посвященные CUDA и вычислениям на GPUСо списком книг, посвященных CUDA и вычислениям на GPU, можно ознакомиться здесь.

СкачайтеCUDA http://developer.nvidia.com/cuda-downloads Nsight http://www.nvidia.com/object/nsight.html

Page 19: CUDA АЛЬМАНАХ СЕНТЯБРЬ 2016 · 2016-10-03 · cuda ВрачВиВс поильзуа 2016 4 «Электронные медицинские карты используются

CUDA АЛЬМАНАХ / СЕНТЯБРЬ 2016 19

КОНТАКТЫ

Если вы хотите, чтобы ваша статья

появилась в следующем выпуске

CUDA Альманах пишите нам на:

Лидия Андреева

[email protected]

По вопросам приобретения NVIDIA GPU

и по прочим техническим

вопросам пишите нам на:

Антон Джораев

[email protected]