Få Google Gemini til at "se med", mens du laver ting og sager på computeren - du kan tale med den og få den til at gøre alt muligt.

Start med at se f.eks. denne YouTube-video om Google Gemini's evne til at hjælpe dig, mens du arbejder på din computer: Gemini 2.0 Can Watch Your Screen & Guide You in Real-Time - YouTube

Det er jo ret imponerende. Jeg fik hele videoen transskriberet med Youtube Transcript Generator - Free and Fast | Kome, kopierede teksten og gav ChatGPT den følgende prompt: 

her er en transkription af en video, der demonstrerer Google Geminis evne til at "se" den skærm man har på sin computer og hjælpe en med ting og sager. Lav en opskrift på, hvordan man gør, og giv mig fem idéer til, hvad jeg kan bruge det til. Her kommer teksten: (og så indsatte jeg den transskriberede tekst fra YouiTube-videoen).

ChatGPT svarede det følgende: 

Trin-for-trin-guide: Sådan får du Gemini til at “se” din skærm

  1. Log ind i Google AI Studio
    Gå til https://aistudio.google.com, log ind med din Google-konto, og vælg det projekt, du vil arbejde i. Funktionen kræver adgang til Gemini 2.0-modellerne (Gemini 2.5 Pro eller nyere). (Gemini 2.0: Level Up Your Apps with Real-Time Multimodal Interactions, Live API | Gemini API | Google AI for Developers)

  2. Aktivér Stream in real time
    I venstremenuen klikker du på “Stream in real time”. Første gang vil AI Studio bede om tilladelse til at bruge mikrofon og skærmdeling i din browser. Giv begge tilladelser. (7 Use Cases of Gemini's Screen Sharing Feature (incl. Setup))

  3. Vælg videokilde: din skærm
    Tryk på kamera-ikonet ( 🎥 ) → Select video sourceScreenEntire screenShare. Nu modtager Gemini en live videostrøm af, hvad der sker på din skærm.

  4. Start en samtale
    Skriv eller tal: “Hej Gemini, kan du se min skærm?” Når modellen bekræfter, kan du give konkrete instruktioner – fx “Følg med mens jeg scroller, og noter alle animationer” eller “Vis mig hvor jeg henter Git til Windows”.

  5. Arbejd i realtid
    – Stil opfølgende spørgsmål mens du klikker rundt.
    – Brug Markdown-prompten */continue* for at få Gemini til at lytte videre uden at afbryde.
    – Hvis modellen mister forbindelsen, klik Stop stream og Start igen.

  6. Afslut og beskyt dit privatliv
    Når du er færdig, klik Stop sharing i browseren. Video­strømmen gemmes ikke på Googles servere ifølge Live-API-dokumentationen, men undlad altid at vise fortrolige data. (Live API | Gemini API | Google AI for Developers)


Fem idéer til, hvad du kan bruge funktionen til

# Idé Eksempel-prompt
1 Live software-vejledning “Se min Premiere Pro-timeline og vis præcis, hvordan jeg lægger et fade-in på lydsporet.”
2 UX-analyse af websites “Hold øje mens jeg scroller på gucci.com og lav en komplet liste over alle micro-animationer og CTA-placeringer.”
3 Hands-on fejlfinding “Jeg får en compile-fejl i VS Code – følg med og fortæl mig, hvilken linje der forårsager problemet.”
4 Sprog-coach i realtid “Mens jeg læser denne japanske artikel, markerer du ord jeg ikke forstår og giver en kort oversættelse i kanten.”
5 Tilgængeligheds-check “Se min Figma-prototype og peg på elementer der mangler kontrast- eller tastatur-navigation.”

Med Gemini som “co-pilot” på skærmen slipper du for at skifte mellem skærmbilleder, tage screenshots eller forklare komplekse trin – AI-en ser nøjagtigt det samme som dig og kan reagere med det samme.

Kommentarer

Populære opslag fra denne blog

Lav verdens bedste prompt i o3 og brug den til Deep Research

Deep Research ("Grundig Research") er nu tilgængelig i ChatGPT (men kun 10 af dem per måned).

Få opsummeret lange videoer på sekunder - og brug det kreativt, f.eks. med TED Talks. Og opdag oven i købet fremtidens undervisningsform :-).