Despre Bogdan
Bogdan Bocșe este fondatorul Envisage.ai si Knosis.ai. Spune că misiunea reunită a celor două companii este să facă mașinile de calcul să înțeleagă și să explice ceea ce văd. A absolvit facultatea de Automatică și Calculatoare în cadrul Universității Politehnice București. Cu experiență în domeniile deep learning, big data și în proiectarea arhitecturilor de calcul pentru cloud, Bogdan e mânat de curiozitate și crede ca pentru o minte deschisă nu există uși închise.”
Envisage.ai
Envisage.ai este o soluție completă pentru analiza în timp real a fluxurilor video și a fotografiilor, în scopul recunoașterii faciale, recunoașterii obiectelor și anomaliilor. Prin structura sa modulară bazată pe standardul DeepVISS (Deep Vision Interoperability Integration Standards), Envisage poate scala, folosind mai multă sau mai puțină putere de procesare, în funcție de complexitatea scenelor analizate și a algoritmilor folosiți.
În ce constă caracterul de inovare al proiectului? Prin ce diferă față de alte abordări potențial existente pe piață?
Abordarea Envisage.ai este bazată pe standardul deschis DeepVISS, ceea ce permite integrarea facilă, prin instalare, a componentelor noi, pentru alte tipuri de analiză, chiar dacă respectivele componente au fost dezvoltate de terți.
Rulare independentă de context, pe CPU x64 (server, browser), ARM (iOS, Android), nVIDIA (GPU), ceea ce permite folosirea Envisage atât pentru puncte de observație fixe (dispecerat, centru comandă), dar și fixe
Care sunt capabilitățile curente ale proiectului? Cum descrieți performanța proiectului?
- Recunoaștere facială cu performanță 99.1% – 99.5% (în funcție de algoritmul folosit)
- Cadența analizei: 2-3 cadre / secundă / flux video
- Comparații faciale: 100.000-200.000 / secunda / core CPU
- Recunoaștere obiecte (definite de client)
- Recunoașterea anomaliilor și a mișcărilor neperiodice
- Stocarea profilelor persoanelor sau obiectelor
- Analiza interoperabilă imaginilor statice și a fluxurilor video
- Integrare prin DeepVISS (bazat pe OpenAPI); extensenbilitate;
- Posibilitate de instalare pe orice computer cu procesor x64
- Bază de date distribuită folosind Solr
- Căutare retroactivă în fluxuri video
- Integrare cu Knosis, pentru îmbogățirea modelelor de analiză vizuală pe baza informațiilor furnizate de operatori umani
Care sunt conceptele, tehnologiile, standardele utilizate și/sau generate în realizarea proiectului?
- Folosirea standardului DeepVISS (Deep Vision Interoperability Specification Standard)
- OpenAPI – pentru definirea independentă de limbaj de programare a DeepVISS
- Java SpringBoot – pentu serverul de aplicație
- Docker – pentru instalare și scalare flexibiliă a infrastructurii de calcul
- TensorFlow – pentru antrenarea și rularea modelelor de machine learning
- OpenCV – pentru funcții de procesare video
- Solr – bază de date distribuită
Care sunt intențiile de dezvoltare ulterioară a capabilităților?
Avem în lucru portarea capabilităților Envisage.ai pe mai multe arhitecturi de procesare, pentru a putea rula complet toată stiva de algoritmi pe telefoane mobile, în browser sau într-un punct de observație mobil (exemplu: mini-PC, NUC).
Atât individual, cât și în colaborare cu rețeaua noastră de parteneri de dezvoltare, vizăm adăugarea modulară a următoarelor clase de procesare video:
- Detecția anomaliilor video generice, nerecunoscute, în scopul atenționării operatorului uman
- Detectarea manipularii sau tentativei de falsificare a imaginilor (util la identificarea voluntara)
- Vedere și analiză multi-spectrală integrată (nocturnă, ceață)
- Estimarea densității și direcției aglomerațiilor de persoane.
- Detectare rapidă de semne (de exemplu, circulatie) și alte însemne rigide.
- Detectarea posturii si a caracteristicilor logopedice ale subiecților monitorizati
- Detectarea comportamentului si a acțiunilor întreprinse de subiecților, pe baza invariantilor geometrici, a posturi si a caracteristicilor logopedice
- Recunoaștere faciala parțială. Recunoaștere faciala perioculara (util pentru persoane cu chipul acoperit, masca anti-gripa). Recunoaștere facială a chipurilor parțial disponibile (fotografii incomplete)”
- Segmentarea automată a obiectelor de interes din imagini
- Recompunere a mai multor cadre de calitate inferioară într-un singur „portret-robot” de calitate superioara pentru scopul de a fi discernabil de factorul uman.
- Recunoașterea imaginilor folosite în tentative de fraudă folosind documente de identite pe baza invarianței semnăturilor geometrice si cromatice ale obiectelor segmentate
- Detector de chipuri generate artificial („deep fake”)
Detectarea expresiilor faciale în timp real.