Почему в данных трекинга взгляда Tobii есть лишние строки данных
Узнайте, почему выходные данные трекинга взгляда Tobii содержат лишние строки за пределами ожидаемой длительности испытания. Узнайте о буферизации, задержках обработки и практических решениях для точного анализа данных.
Почему в выходных данных отслеживания взгляда Tobii содержится больше строк, чем ожидалось на основе длительности испытания?
Я столкнулся с проблемой с данными отслеживания взгляда Tobii, при котором количество строк в выходных данных взгляда превышает то, что можно было бы ожидать от фактической длительности испытания. Мой эксперимент включает:
- 500ms экран с фиксационным крестом
- 5000ms экспериментальное испытание с:
- Изображениями, отображаемыми на протяжении всего времени
- 3000ms видео, которое переходит в статичное изображение
- Экран решения отображается до ответа испытуемого
Файл журнала Tobii подтверждает правильную длительность 5000ms (с незначительными отклонениями 8-16ms/кадр), но выходные данные взгляда содержат дополнительные строки сверх тех, что соответствовали бы этой длительности. Каждая строка представляет 8ms кадр, однако я иногда наблюдаю секунды лишних строк, несмотря на плавное выполнение эксперимента и отсутствие задержек.
Что могут означать эти дополнительные строки в выходных данных взгляда Tobii, и как можно устранить это несоответствие между длительностью файла журнала и выходными данными?
Дополнительные строки в выходных данных отслеживания взгляда Tobii возникают из-за внутреннего буферизации данных, задержек обработки и асинхронного характера потоковой передачи данных, даже когда тайминг вашего эксперимента кажется правильным. Это расхождение между длительностью файла журнала и выходными данными является распространенным явлением в системах отслеживания взгляда, когда процесс выборки продолжается кратковременно после официального окончания вашего испытания из-за внутренних конвейеров обработки и механизмов буферизации.
Содержание
- Понимание расхождения данных
- Технические причины дополнительных строк
- Проблемы буферизации и конвейерной обработки
- Изменчивость частоты дискретизации
- Фильтрация данных и контроль качества
- Практические решения
- Лучшие практики очистки данных
Понимание расхождения данных
Несоответствие между вашим файлом журнала Tobii, показывающим длительность 5000 мс, и данными отслеживания взгляда, содержащими дополнительные строки, возникает из-за фундаментальных различий в том, как системы отслеживания взгляда обрабатывают время. Как объясняется на одном из форумов разработчиков, “Нет настройки, которая бы делала частоту данных постоянной от EyeX” - частота зависит от множества факторов, включая фильтрацию данных и качество.
Это создает ситуацию, при которой:
- Ваше программное обеспечение для управления экспериментом считает, что испытание заканчивается ровно через 5000 мс
- Внутренняя обработка трекера взгляда Tobii продолжается кратковременно из-за буферизации
- Данные из непосредственного пост-испытательного периода включаются в ваши выходные данные
Каждая строка 8 мс представляет интервал дискретизации, но трекер взгляда не останавливается точно в момент окончания вашего испытания. Вместо этого он завершает свой конвейер обработки, что может привести к захвату и включению в выходные данные нескольких сотен дополнительных миллисекунд данных.
Технические причины дополнительных строк
Несколько технических факторов способствуют этому явлению:
Компоненты задержки “от конца до конца”
Система отслеживания взгляда включает несколько этапов обработки, которые создают расхождения во времени:
- Время экспонирования камеры трекера взгляда
- Время считывания и передачи изображения
- Время обработки изображения
- Время передачи данных между движком Tobii EyeX и вашим приложением
- Тайминг частоты обновления дисплея
Как отмечено в исследованиях, “Эта задержка от конца до конца состоит из времени экспонирования камеры трекера взгляда, времени считывания и передачи изображения, времени обработки изображения, времени передачи данных между движком Tobii EyeX и конечным приложением, а также частоты обновления дисплея.”
Уровни обработки потока данных
Tobii предлагает разные уровни обработки (None, Low, Medium, High), которые влияют на то, как обрабатываются данные:
- Low: Сырые данные взгляда с минимальной обработкой
- Medium: Уровень по умолчанию с некоторой фильтрацией
- High: Максимальное сглаживание и фильтрация
Как отметил один из разработчиков, “уровень обработки Medium или High означает, что Optikey подписывается на FixationDataStream с движком EyeX, а не на GazePointDataStream”, что может引入 дополнительные задержки обработки.
Проблемы буферизации и конвейерной обработки
Основная проблема заключается в архитектуре буферизации данных Tobii:
Конструкция внутреннего буфера
Трекеры взгляда не обрабатывают данные в реальном времени, а используют внутренние буферы, которые:
- Собирают несколько выборок перед обработкой
- Применяют алгоритмы фильтрации
- Обрабатывают задержки передачи по сети
- Управляют синхронизацией данных между различными компонентами
Эта буферизация означает, что когда ваше испытание официально заканчивается, трекер взгляда все еще может иметь:
- Частично обработанные выборки в своем конвейере
- Буферизованные данные, ожидающие передачи
- Данные из непосредственного пост-испытательного периода, которые не были полностью обработаны
Асинхронная потоковая передача данных
Система Tobii работает асинхронно, что означает:
- Сбор данных продолжается кратковременно после окончания испытания
- Трекеру взгляда требуется время для очистки своих внутренних буферов
- Передача по сети может引入 дополнительные вариации времени
Это объясняет, почему вы видите “секунды дополнительных строк, несмотря на плавное выполнение эксперимента и отсутствие задержек” - трекер взгляда завершает свой конвейер обработки после того, как ваше программное обеспечение управления сигнализировало об окончании испытания.
Изменчивость частоты дискретизации
Трекеры взгляда Tobii не поддерживают идеально постоянную частоту дискретизации, что способствует расхождению:
Динамические частоты дискретизации
Частота дискретизации варьируется в зависимости от:
- Качества данных и надежности отслеживания
- Настроек уровня обработки
- Нагрузки системы и производительности оборудования
- Производительности алгоритма отслеживания взгляда
Согласно документации Tobii, “частота дискретизации tobii составляет 90 Гц”, но на практике это может варьироваться. Современные системы Tobii Pro могут захватывать “данные взгляда со скоростью до 250 Гц”, но фактические частоты зависят от различных факторов.
Обработка недействительных данных
Система отбрасывает недействительные точки данных, что создает изменчивость частоты дискретизации:
- Плохое качество отслеживания приводит к пропущенным выборкам
- Обнаружение моргания удаляет недействительные точки взгляда
- Проблемы калибровки создают пробелы в сборе данных
Эта изменчивость означает, что со временем фактическое количество собранных выборок может отличаться от того, что вы ожидали бы на основе расчета с фиксированной частотой дискретизации.
Фильтрация данных и контроль качества
Tobii применяет несколько фильтров, которые влияют на конечные выходные данные:
Алгоритмическая фильтрация
Трекер взгляда применяет сложные алгоритмы, включая:
- Фильтрацию на основе рассеяния (похожую на алгоритм Tobii Clearview)
- Метод MouldDur с “фиксированным порогом длительности (по умолчанию = 100 мс)”
- Фильтрацию на основе скорости для обнаружения саккад
Эти фильтры работают с буферизованными данными и могут引入 задержки времени при обработке нескольких выборок для определения их достоверности.
Задержки пост-обработки
Дополнительная обработка происходит после сбора данных:
- Алгоритмы обнаружения фиксации взгляда
- Идентификация саккад
- Интерполяция и сглаживание данных
Каждый из этих этапов обработки добавляет задержку и может привести к тому, что данные будут включены в ваши выходные данные даже после того, как ваше испытание официально завершилось.
Практические решения
Для решения проблемы дополнительных строк рассмотрите следующие подходы:
Корректировки конструкции испытания
- Время буфера: Добавьте небольшой буфер (100-200 мс) в конце каждого испытания для учета задержек обработки
- Маркеры синхронизации: Включите четкие маркеры начала/конца в ваш поток данных для точного выравнивания времени
- Отметки времени оборудования: Используйте отметки времени оборудования вместо программного тайминга для более точного сегментирования данных
Техники обработки данных
- Фильтрация на основе времени: Фильтруйте данные на основе фактических отметок времени испытания, а не количества строк
- Сегментирование на основе маркеров: Используйте маркеры эксперимента для точной идентификации периодов с действительными данными
- Очистка пост-обработки: Реализуйте скрипты для удаления данных за пределами ваших предполагаемых окон испытаний
Корректировки конфигурации
- Уровень обработки: Экспериментируйте с разными уровнями обработки, чтобы найти оптимальный баланс
- Частота дискретизации: Если возможно, настройте параметры частоты дискретизации на более предсказуемые значения
- Параметры фильтрации: Изучите и, при необходимости, скорректируйте внутренние пороговые значения фильтрации
Лучшие практики очистки данных
Автоматизированная обработка данных
Реализуйте надежные процедуры очистки данных, которые:
- Идентифицируют и удаляют данные за пределами предполагаемых временных окон
- Правильно обрабатывают отсутствующие или недействительные данные
- Учитывают изменчивые частоты дискретизации
- Применяют последовательную фильтрацию во всех испытаниях
Проверки контроля качества
- Сравнивайте длительности файлов журнала с фактическими длительностями данных
- Мониторьте последовательные паттерны в дополнительных данных
- Проверяйте точность времени в различных типах испытаний
- Документируйте любые систематические расхождения для будущего анализа
Документирование и прозрачность
Ведите подробные записи о:
- Версиях прошивки и программного обеспечения Tobii
- Настройках уровня обработки
- Конфигурациях частоты дискретизации
- Любых наблюдаемых расхождениях данных и способах их обработки
Этот подход гарантирует, что ваш анализ учитывает присущие характеристики данных отслеживания взгляда, сохраняя научную строгость в ваших экспериментальных результатах.
Источники
- Stack Overflow - Выходные данные Tobii показывают больше строк, чем ожидалось
- Tobii Developer Zone - Исправление частоты дискретизации/обновления
- Springer - Оценка контроллера отслеживания взгляда Tobii EyeX и инструментария Matlab для исследований
- Tobii Developer Zone - О частоте дискретизации tobii
- Springer - Gazepath: Инструмент анализа отслеживания взгляда, учитывающий индивидуальные различия и качество данных
- Tobii Products - Программные решения
- Tobii Developer - EyeTracker
- Leiden University - Руководство пользователя трекера взгляда Tobii Pro X3-120
Заключение
Дополнительные строки в ваших данных отслеживания взгляда Tobii являются нормальным артефактом внутреннего конвейера обработки и механизмов буферизации трекера взгляда, а не указанием на ошибки эксперимента или проблемы с таймингом. Для решения этого расхождения:
- Добавьте время буфера в конструкцию вашего испытания для учета задержек обработки
- Реализуйте фильтрацию на основе времени вместо того, чтобы полагаться на количество строк
- Используйте маркеры синхронизации для точной идентификации периодов с действительными данными
- Документируйте систематические различия для прозрачности вашего анализа
- Экспериментируйте с уровнями обработки для поиска оптимальных настроек для вашего конкретного случая использования
Понимая технические причины этого явления и реализуя соответствующие процедуры очистки данных, вы можете обеспечить точный и надежный анализ отслеживания взгляда, несмотря на присущие расхождения во времени в системе.