Alle samlinger
Arkivert
Teknologien bak vårt AI-baserte Bildesøk
Teknologien bak vårt AI-baserte Bildesøk

Les mer om teknologien bak AI-basert bildesøk

Oppdatert over en uke siden

Vårt AI-baserte Bildesøk er basert på forskningen til OpenAI og bruker GPT-lignende naturlig språkbehandling, kombinert med toppmoderne visuell forståelse for å gi en overlegen bildesøkeopplevelse.

Vår AI-baserte Bildesøk-funksjon er ferdig trent til å analysere og finne bilder som matcher søket ditt. Vi bruker forhånstrente modeller som er optimalisert på et stort datasett, for å nøyaktig gjenkjenne og kategorisere ulike typer visuelt innhold.

Slik fungerer det:

  1. Vi bruker forhåndstrente AI-modeller: Vi benytter AI-modeller som allerede er trent på store, eksterne, datasett med bilder og tekster. Vi trener ikke modellene videre basert på dine bilder, på den måten sikrer vi en helt trygg tjeneste som samtidig tar spesielt hensyn til personvern.

  2. Vi gjør om bildene til vektorer: Når du laster opp bilder til Jottacloud, analyserer vår AI-modell automatisk innholdet i hvert bilde og lager en vektorrepresentasjon av hvert bilde. En vektor er en matrise med hundrevis av tall som ikke kan leses av mennesker, men som gjør det mulig å sammenligne én vektor med en annen vektor.

  3. Vi gjør om søketeksten til en vektor: Når du beskriver bildet du leter etter, konverterer vi også søketermen til en vektorrepresentasjon.

  4. Vi sammenligner vektorene: Nå beregner vi avstanden mellom søkevektoren som ble laget fra søket ditt, til bildevektorene knyttet til hvert bilde du har lagret hos oss. Hvis avstanden mellom vektorene er liten betyr det at vektorene ligner på hverandre. Da sier vi at likhetsscoren mellom de to vektorene (søket og bildet) er høy

  5. Vi viser deg resultatet: Vi sorterer bildene fra høyest til lavest likhetsscore, slik at du får se de mest nøyaktige og relevante bildene basert på søkeforespørselen din

  6. Vi gjør det raskt: Fra du søker til resultatet dukker opp går det 0.3 sekunder. Ganske kult, ikke sant?

Nåværende begrensninger med vårt AI-baserte Bildesøk:

  • Vi har for øyeblikket ikke personlig ansiktsgjenkjenning, det vil si muligheten til å tagge spesielle personer med navn. Modellen forstår og gjenkjenner imidlertid ansikter, og ved å bruke "Finn lignende" verktøyet, kan du finne bilder som har de samme personene i dem. Muligheten for å tagge personer er noe vi sannsynligvis vil legge til i nær fremtid!

  • Lokasjonen der bildet ble tatt som kan hentes fra metadaten er foreløpig ikke integrert i søket, hvilket betyr at geografiske søk er begrenset. Modellen gjenkjenner imidlertid kjente steder, byer og regioner, slik at søk etter "Eiffeltårnet i Frankrike" eller "Taj Mahal" vil gi svært nøyaktige resultater. Den kan også forstå om bilder er tatt i New York, Paris eller London, da modellen er trent på millioner av bilder.

  • For øyeblikket støtter ikke modellen søk etter tidsperioder, her må man foreløpig benytte seg av tidslinjen

  • Den er begrenset av det visuelle innholdet i bildene dine, som kanskje ikke alltid representerer nøyaktig det du søker etter (hvis kvaliteten på bildet er dårlig, vinkelen er rar, lyset er dårlig, osv).

Svarte dette på spørsmålet?