Netzgemeinde Hubzilla
Anmelden
Registrieren
Netzgemeinde Hubzilla
Anmelden
Registrieren
Channel Apps
Kanal
Über
Fotos
Dateien
Kalender
Artikel
Karten
Wikis
System Apps
Fehler melden
Hilfe
QRator
Sprache
Suche
Verzeichnis
Zufälliger Kanal
Image descriptions in the Fediverse
2025-03-17 19:20:29
Profil ansehen
Jupiter Rowland
jupiter_rowland@hub.netzgemeinde.eu
Link to an article on what I've learned about describing images for the Fediverse; CW: Fediverse meta, Fediverse beyond Mastodon meta, alt-text meta, image description meta
Artikel ansehen
Zusammenfassung ansehen
@
accessibility group
@
a11y group
New rant/article:
I have learned a lot about describing images according to Mastodon's standards, and I want to share my knowledge, but I haven't learned enough
#
FediMeta
#
FediverseMeta
#
CWFediMeta
#
CWFediverseMeta
#
Fediverse
#
AltText
#
AltTextMeta
#
CWAltTextMeta
#
ImageDescription
#
ImageDescriptions
#
ImageDescriptionMeta
#
CWImageDescriptionMeta
#
Inclusion
#
A11y
#
Accessibility
Fediverse
Accessibility
1
gaydar jammer
Link zur Quelle
show all
8 comments
2025-03-17 19:29:54
Profil ansehen
*_jayrope
jrp@hub.kliklak.net
@
Jupiter Rowland
Was hältst Du vom Altbot?
Link zur Quelle
2025-03-17 20:25:47
Profil ansehen
Jupiter Rowland
jupiter_rowland@hub.netzgemeinde.eu
@
*_jayrope
Von KI für Bildbeschreibungen für meine Bilder halte ich gar nichts. Meine Bilder sind über ein extremes Nischenthema, und um sie zu beschreiben und zu erklären, braucht es extremes Nischenwissen.
Ich hab's demonstrativ zweimal mit LLaVA versucht.
Dieses Bild
habe ich selbst in acht Stunden und über 25.000 Zeichen beschrieben. LLaVA hat in vielleicht einer halben Minute etwas über 550 Zeichen rausgetan.
Hier ist der direkte Vergleich
.
Fazit:
Ich konnte haarklein erklären, wo das Bild gemacht wurde, und zwar so, daß es auch ein Laie versteht. Der Ort, die Sim, das Grid, die Software darunter, was es mit der Software auf sich hat, was ein Grid ist, was eine Sim ist usw. usf. etc. pp. Das ist es, was die Leute wissen müssen. LLaVA konnte nur grob spekulieren.
Ich habe den Avatar recht detailliert beschrieben, LLaVA überhaupt nicht und ihn als "Charakter" bezeichnet.
LLaVA hat darüber halluziniert, wohin der Avatar guckt. Ich wußte es, obwohl es von hinten gar nicht sichtbar ist. Ich konnte auch sagen, warum der Avatar von hinten zu sehen ist.
LLaVA hat Text in dem Bild nicht mal gefunden. Ich habe fast alles an Text, was für mich irgendwie lesbar war. wortwörtlich transkribiert. Ich glaube, ich habe nur ein Nummernschild über einer Tür auf einem Bild in diesem Bild vergessen.
Ich habe von dem Ort den popkulturellen Bogen zu Edgar Wallace und zum Frühstyxradio schlagen können. LLaVA nicht.
LLaVA hat nicht mal geschrieben, daß das Bild schwarzweiß ist. Ich habe korrekt geschrieben, daß in Wahrheit alles in-world von der Szenerie bis hin zum Avatar schwarzweiß ist.
Dieses ominöse Gebilde rechts im Bild? LLaVA hat es nicht mal wahrgenommen. Ich habe es in 3000 Zeichen beschrieben und in weiteren 2500 Zeichen erklärt.
Bei der Tageszeit hat LLaVA sich total verhauen, weil es weder wußte, in welche Richtung die Kamera zeigt, noch, wie hoch die Bäume eigentlich sind, die die Schatten werfen.
LLaVA hat auch keinen der Bäume als Bergkiefer identifizieren können.
Das wird der Altbot nicht signifikant besser können.
#
Long
#
LongPost
#
CWLong
#
CWLongPost
#
LangerPost
#
CWLangerPost
#
Bildbeschreibung
#
Bildbeschreibungen
#
BildbeschreibungenMeta
#
CWBildbeschreibungenMeta
#
AI
#
KI
#
LLaVA
#
Altbot
Link zur Quelle
2025-03-17 20:44:57
Profil ansehen
*_jayrope
jrp@hub.kliklak.net
@
Jupiter Rowland
Dank dafür. Warum sehe ich das Bild in Deiner Antwort oben nicht, nicht einmal als Attachment - während
https://channel.org/@ai
- welches deine Antwort geboostet hat, das Bild
inline
in Deiner Antwort zeigt? Nur ne Nebenfrage.
Link zur Quelle
2025-03-17 21:29:21
Profil ansehen
Samuel Lison :lagr_elephant:
samuel@social.familylison.com
Link to an article on what I've learned about describing images for the Fediverse; CW: Fediverse meta, Fediverse beyond Mastodon meta, alt-text meta, image description meta
Artikel ansehen
Zusammenfassung ansehen
@jupiter_rowland
@accessibility
@a11y
Nice article. I also did not know much about the importance of alt text prior to getting onto the
#Fediverse
.
#PixelFed
is probably more demanding than
#Mastodon
of it due to being more about photography. But even on my HTML static websites now I see the importance! I use to be so lazy!
Link zur Quelle
2025-03-17 21:52:13
Profil ansehen
Jupiter Rowland
jupiter_rowland@hub.netzgemeinde.eu
@
*_jayrope
Seltsam, eigentlich ist das öffentlich.
Link zur Quelle
2025-03-17 21:55:57
Profil ansehen
*_jayrope
jrp@hub.kliklak.net
@
Jupiter Rowland
Okay, wahrscheinlich wieder son kryptischer Hubzilla-Permission-Dings. Mit diesem Zeugs treibt mich dieser Nerd-Mercedes noch in den Wahnsinn.
Link zur Quelle
2025-03-17 23:08:58
Profil ansehen
Jupiter Rowland
jupiter_rowland@hub.netzgemeinde.eu
@
*_jayrope
Das Bild an sich wäre
das hier
.
Link zur Quelle
2025-03-17 23:22:55
Profil ansehen
*_jayrope
jrp@hub.kliklak.net
@
Jupiter Rowland
Ja, klar. Das habe ich ja auf dem Mastodonprofil von @
AI
gesehen.
Link zur Quelle
Konversationsmerkmale
Lädt...
älter
Konversationsmerkmale
Lädt...