mastodontech.de ist einer von vielen unabhängigen Mastodon-Servern, mit dem du dich im Fediverse beteiligen kannst.
Offen für alle (über 16) und bereitgestellt von Markus'Blog

Serverstatistik:

1,4 Tsd.
aktive Profile

#synthid

0 Beiträge0 Beteiligte0 Beiträge heute

Google ulepsza edycję zdjęć w Gemini. AI ma teraz zachowywać tożsamość osób

Google ogłosiło wprowadzenie znaczącej aktualizacji funkcji edycji obrazów w aplikacji Gemini. Nowy model, opracowany przez laboratorium DeepMind, ma rozwiązać jeden z największych problemów generatorów AI – zachowanie spójnego wyglądu postaci na modyfikowanych i nowo tworzonych (generowanych przez AI) zdjęciach.

Jednym z największych wyzwań dla narzędzi opartych na sztucznej inteligencji było do tej pory wierne odwzorowanie konkretnych osób. Często po edycji, np. zmianie tła lub ubrania, twarz na zdjęciu była „podobna, ale nie identyczna”. Najnowsza aktualizacja Gemini ma to zmienić. Jak informuje Google, algorytmy zostały udoskonalone, aby precyzyjnie zachowywać rysy twarzy i wygląd osób, a nawet zwierząt, niezależnie od wprowadzanych zmian.

Apple rozmawia z Google o wsparciu Siri przez Gemini AI

Zaktualizowane narzędzie wprowadza kilka nowych, praktycznych funkcji. Użytkownicy mogą teraz przesłać zdjęcie i za pomocą poleceń tekstowych zmieniać strój czy scenerię, w której znajduje się dana osoba. Możliwe stało się także łączenie kilku fotografii w jedną spójną scenę, na przykład umieszczenie portretu swojego i swojego psa na zupełnie nowym, wygenerowanym tle. Gemini pozwala również na edycję wieloetapową, czyli stopniowe dodawanie lub zmienianie elementów na obrazie.

Wśród ciekawszych nowości znalazła się funkcja „miksowania stylów”. Pozwala ona na przeniesienie wzoru lub tekstury z jednego obrazu na obiekt znajdujący się na drugim. W materiałach Google jako przykład podano możliwość zaprojektowania sukienki z wzorem skrzydeł motyla lub stworzenie kaloszy, których faktura imituje płatki kwiatów. Wszystkie te operacje mają odbywać się z zachowaniem oryginalnego wyglądu kluczowych obiektów.

Google podkreśla również dbałość o transparentność. Firma zapewnia, że wszystkie obrazy, które zostały stworzone lub zmodyfikowane w aplikacji Gemini, będą oznaczane. Na każdej grafice umieszczony zostanie widoczny znak wodny, a dodatkowo w pliku zaszyty będzie niewidoczny cyfrowy znacznik SynthID, który pozwoli jednoznacznie zidentyfikować materiał jako wygenerowany przez AI. Zaktualizowane funkcje są dostępne dla użytkowników od dziś.

#AI#aktualizacja#Aplikacje

Gemini 2.5: Google erweitert Audio-Funktionen seiner KI-Plattform
Google stellt mit Gemini 2.5 die neueste Version seiner KI-Plattform vor. Im Fokus stehen Fortschritte in der Verarbeitung und Generierung von Audioinhalten. Die multimodale KI
apfeltalk.de/magazin/news/gemi
#News #Tellerrand #AudioVerarbeitung #Gemini25 #Google #GoogleAIStudio #KI #KnstlicheIntelligenz #MultimodaleKI #SynthID #TexttoSpeech #VertexAI

Deepfakes, KI-Bilder, synthetische Stimmen – wie erkennst Du, was echt ist? Google stellt mit SynthID ein neues Tool vor, das maschinenlesbare Wasserzeichen in Medien erkennt. Aber wie zuverlässig ist das Ganze wirklich – und wer kontrolliert die Kontrolle? Lies mehr: #Google #SynthID #KI 👇
all-ai.de/news/news24/google-k

All-AI.deGoogle enthüllt KI-Detektor für Deepfakes und Co.Der SynthID Detector soll KI-Inhalte entlarven – doch erkennt er wirklich alles? Wo liegen die Grenzen der Technologie?

Google DeepMind is making its AI text watermark open source

Google DeepMind has developed a tool for identifying AI-generated text and is making it available open source. SynthID works by adding an invisible watermark directly into the text when it is generated by an AI model.

#Google #DeepMind #SynthID #ArtificialIntelligence #AI #GenAI #LLM #watermark #technology #tech #innovation #opensource

technologyreview.com/2024/10/2

MIT Technology Review · Google DeepMind is making its AI text watermark open sourceVon Melissa Heikkilä