Ошибка. Неверный логин или пароль
Авторизация
Авторизован
Личный кабинет
Вход
slg_qr_code
ИНФОРМАЦИОННО-КОНСАЛТИНГОВАЯ ГРУППА
ИНФОРМАЦИОННО-КОНСАЛТИНГОВАЯ ГРУППА
SLG  pRAKTIK
Bias в датасете — это систематическое отклонение в данных, которое приводит к предвзятым результатам модели. Это проблема, которая возникает, когда данные, используемые для обучения модели, не отражают реальные сценарии, для которых она предназначена. dzen.ru

Типы bias

Некоторые типы bias в датасете:
  • Ошибка отбора (selection bias). Данные не выбираются случайно, что приводит к перепредставленности или недопредставленности определённых групп или сценариев.
  • Предвзятость измерений (measurement bias). Возникает из-за проблем в инструментах или процессе сбора данных.
  • Предвзятость меток (label bias, annotation bias). Происходит из-за несоответствий или предубеждений на этапе маркировки данных, когда люди-аннотаторы могут по-разному интерпретировать или маркировать данные.
  • Историческая предвзятость (historical bias). Отражает существующие общественные предубеждения, которые запечатлены в данных.
 

Причины возникновения bias

Bias может быть вызван, например:
  • Неправильным сбором данных. Например, отбором в выборку только схожих между собой данных.
  • Неправильным формированием тренировочного набора.
  • Неправильным измерением ошибок.
 

Методы борьбы с bias

Для борьбы с bias в датасете используются, например:
  • Увеличение разнообразия данных. Сбор большего количества образцов из недопредставленных сценариев.
  • Дополнение данных. Переворачивание, вращение, регулировка освещения и масштабирование объектов помогают смоделировать различные реальные условия.
  • Использование метрик справедливости. Эти метрики оценивают, как модель ведёт себя на разных подмножествах данных, и помогают выявить «слепые пятна».
 

Примеры bias

Некоторые примеры bias в датасете:
  • Гендерное смещение. Модель чаще связывает профессии «учёный» с мужчинами, а «медсестра» — с женщинами.
  • Региональное смещение. Модель может давать приоритет информации на английском языке и игнорировать менее популярные языки.
  • Стереотипы. Модель может усиливать стереотипные представления в ответах.

"Мышление PraktiK". Словарь программы

Яндекс.Метрика
Напишите нам
это поле обязательно для заполнения
Ваше имя*
это поле обязательно для заполнения
Телефон:*
это поле обязательно для заполнения
Комментарий*
это поле обязательно для заполнения
Галочка*
Спасибо! Форма отправлена