Архив статей журнала
В последние годы актуальность технологий компьютерного зрения значительно возросла, особенно в задачах анализа видеопотока, таких как обнаружение усталости, защита от подделок лиц и распознавание жестов. В известных подходах к оценке моделей, применяемых в этих задачах, широко используется метрика ROC AUC. Однако ее применение, основанное на покадровом анализе, имеет определенные ограничения. Они связаны с неустойчивостью результатов из-за нестабильных выходов модели между кадрами и отсутствием учета временных зависимостей в данных, что снижает точность оценки в реальных условиях использования стриминговых видео. Предлагаемый метод решает эти проблемы путем построения ROC-кривых для видео в целом, а не для отдельных кадров. Реализация этого процесса происходит посредством анализа выходов модели на каждом кадре, что позволяет более надежно различать положительные и отрицательные примеры на уровне всего видеофрагмента. Такой подход позволяет реалистично оценивать соотношение ложных срабатываний и полноты, а также улучшает чувствительность моделей за счет подбора более релевантных порогов классификации. Таким образом, новый метод предлагает более релевантную оценку моделей для потоковой обработки видео, обеспечивая более точное распознавание событий и их контекстуальную интерпретацию, что особенно важно в критически значимых приложениях.