Big Data Moscow 2018

Миль Хостенс

UGhent, Бельгия

Биография

Кандидат наук, специалист по управлению здоровьем стада, сосредоточенный на оптимизации показателей продуктивности и воспроизводства в мелких и крупных стадах с упором на питание, в амбулаторной клинике отделения воспроизводства, акушерства и здоровья стада. Лидер 3 проектов с упором на управление данными в проекте ЕС FP7 GplusE.
Обучает магистров в области ветеринарной медицины. Преподает статистику аспирантам в области управления данными для молочных коров. Кандидат наук в области управления здоровьем стада у молочных коров.

Доклад

Новый подход к обработке и прогнозированию данных у молочных коров

Европейский Союз, который является крупным производителем в области животноводства, напрямую затрагивает глобальная потребность в более устойчивом производстве пищевых продуктов. Изменение климата, несомненно, скажется на производстве сельскохозяйственных животных, но здоровье и благополучие домашнего скота также вызывают растущую обеспокоенность общественности. Общим подходом при разработке решений всех этих проблем является повышение продуктивности разведения животных (Симмонс, 2012).
На заболевания при рождении и в ранний период лактации (вскоре после рождения) приходятся основные проблемы со здоровьем и благополучием в производстве молочных продуктов (Дрекли и соавт., 2005). К ним относятся производственные заболевания, такие как жировая дегенерация печени, кетоз, ацидоз рубца и хромота, а также инфекционные заболевания, такие как мастит и инфекции репродуктивного тракта. Бесплодие и заболевания тесно взаимосвязаны через общие метаболические и иммунные сигнальные пути (Мур и соавт., 2005). Дальнейшими последствиями этого являются неоптимальная продуктивность и снижение эффективности воспроизводства. Это, в свою очередь, способствует избыточным выбросам метана и более высоким потерям азота и фосфора из почвы в связи с необходимостью разведения и содержания большего количества производителей.
Благодаря быстрому развитию технологий точного животноводства и доступности высокой пропускной способности от датчиков стали доступны крупномасштабные массивы данных с ряда исследовательских ферм, которые могут служить потенциальным фенотипом для вышеупомянутых задач.
Работа с такими взаимосвязанными задачами требует ранней идентификации с использованием биомаркеров (БМ). Предпочтительной матрицей для измерения биомаркеров является молоко, поскольку оно более доступно, чем кровь, и обеспечивает экономичную автоматическую повторную выборку с использованием недавно разработанных методов линейного отбора и анализа проб (Эггер-Даннер и соавт., 2015). Весьма вероятно, что некоторые структуры N-гликанов (BM-1), метаболиты (BM-2) или инфракрасные спектры в средней области (BM-3) в коровьем молоке могут служить в качестве биомаркеров для прогнозирования одного из вышеупомянутых фенотипов, но сопоставимые методологии прогнозирования отсутствуют.
Машинное обучение часто описывается как ключевая технология, которая позволит извлечь ценные выводы из таких данных (Домингос, 2012). Однако эффективное использование этих технологий требует глубокого понимания молочной промышленности и обработки и анализа данных для очистки и эффективного объединения несколько источников данных, определения соответствующих частей данных, построения и визуализации предметно-ориентированных алгоритмов и валидации моделей прогнозирования. Каждый из этих шагов имеет ключевое значение для эффективного и продуктивного переноса таких моделей в молочную промышленность.
Соответственно в этом методологическом документе рассмотрен полуавтоматический подход к выбору потенциальных кандидатов для будущих моделей прогнозирования в масштабах отрасли. Основная цель данного исследования заключается в классификации 3 типов БМ в соответствии с их прогностической силой в отношении прогнозирования представляющих интерес фенотипов из многостороннего исследования.

Дата: 11 октября, 2018