Tensorflow Lite Posenet или Pose оценка е задачата да се използва ML модел за оценка на позата на човек от изображение или видео чрез оценка на пространственото местоположение на ключовите стави на тялото (ключови точки).
Оценката на позата се отнася до техники за компютърно зрение, които откриват човешки фигури в изображения и видеоклипове, за да може например да се определи къде нечий лакът се показва в изображение. Важно е да сте наясно с факта, че оценката на позата просто преценява къде са ключовите стави на тялото и не разпознава кой е на изображение или видео.
Моделът PoseNet взема обработено изображение от камерата като вход и извежда информация за ключови точки. Откритите ключови точки се индексират с идентификатор на част, с оценка на доверието между 0.0 и 1.0. Резултатът за доверие показва вероятността да съществува ключова точка в тази позиция.
Бенчмаркове за ефективност
Производителността варира в зависимост от вашето устройство и изходна стъпка (топлинни карти и компенсирани вектори). Моделът PoseNet е инвариант на размера на изображението, което означава, че може да предсказва пози на пози в същия мащаб като оригиналното изображение, независимо дали изображението е намалено. Това означава, че конфигурирате модела да има по-висока точност за сметка на производителността.
Изходната стъпка определя колко да се намали изходът спрямо размера на входното изображение. Това влияе върху размера на слоевете и изхода на модела.
Колкото по-висока е изходната стъпка, толкова по-малка е разделителната способност на слоевете в мрежата и изходите и съответно тяхната точност. При това изпълнение изходният ход може да има стойности от 8, 16 или 32. С други думи, изходен ход от 32 ще доведе до най-бързо изпълнение, но най-ниска точност, докато 8 ще доведе до най-висока точност, но най-бавна производителност. Препоръчителната начална стойност е 16.