mastodontech.de ist einer von vielen unabhängigen Mastodon-Servern, mit dem du dich im Fediverse beteiligen kannst.
Offen für alle (über 16) und bereitgestellt von Markus'Blog

Serverstatistik:

1,4 Tsd.
aktive Profile

#largelanguagemodel

1 Beitrag1 Beteiligte*r0 Beiträge heute

LLMs don’t know your PDF.
They don’t know your company wiki either. Or your research papers.

What they can do with RAG is look through your documents in the background and answer using what they find.

But how does that actually work? Here’s the basic idea behind RAG:
:blobcoffee: Chunking: The document is split into small, overlapping parts so the LLM can handle them. This keeps structure and context.
:blobcoffee: Embeddings & Search: Each part is turned into a vector (a numerical representation of meaning). Your question is also turned into a vector, and the system compares them to find the best matches.
:blobcoffee: Retriever + LLM: The top matches are sent to the LLM, which uses them to generate an answer based on that context.

#llm#largelanguagemodel#ai

🧠 Was genau ist eigentlich ein #LLM?

Ein #LargeLanguageModel (LLM) erzeugt mit Hilfe von maschinellem Lernen Texte – so wie dieser hier. Dazu lernt es aus Trainingstexten, wie Wörter miteinander in Verbindung stehen.

In unserer Rubrik #BesserWissen erklären wir, wie ein LLM funktioniert, wo seine Grenzen liegen – und was Jülicher Forschende damit zu tun haben.

📖 Neugierig geworden? In unserem effzett-Magazin gibt es mehr "Besserwisser".

👉 effzett.fz-juelich.de

Illustration: Diana Köhne

Sobre el entrenamiento de los Modelos de Lenguaje Grande (LLM por su sigla en inglés) y el derecho de autor

«Los LLM, siglas en inglés de “Large Language Model”, o en español «modelos de lenguaje grande» son una categoría de modelos de inteligencia artificial (IA) que pueden entender y generar lenguaje humano.

Los LLM son modelos de aprendizaje automático que se entrenan con grandes cantidades de datos. Su arquitectura se basa en redes neuronales que aplican aprendizaje profundo (“deep learning”) para representar las relaciones complejas entre palabras a partir de grandes volúmenes de datos extraídos de internet, libros y artículos científicos.

El aprendizaje profundo se refiere a una forma de aprendizaje automático que emplea redes neuronales de múltiples capas, lo que permite procesar datos no estructurados (como imágenes, videos y texto). A través de este proceso de entrenamiento, que puede tener múltiples etapas e involucrar distintos niveles de intervención humana, los LLMs aprenden cómo se usan las palabras entre sí en el lenguaje, y pueden aplicar estos patrones aprendidos para realizar tareas de procesamiento del lenguaje natural.

LLMs en la práctica clínia Hospital Italiano

Sobre el uso «de grandes volúmenes de datos extraídos de internet, libros y artículos científicos» y el derecho de autor de esos grandes volúmenes de datos, una reflexión de  Sven Slootweg

«Veo que muchas personas responden a la situación de los LLM y los derechos de autor con pedidos de aplicación más estricta de los derechos de autor, y honestamente creo que es una postura terrible.

No porque estas empresas LLM no deban ver consecuencias (¡deberían!), sino porque hay una observación mucho más importante que hacer: esta situación demuestra cómo eso de que «el copyright protege a los artistas» siempre ha sido un mito.

Si los derechos de autor realmente protegieran a los artistas, se habría aplicado con celeridad contra estas empresas de LLM, de la misma manera que se aplica con celeridad cuando se crea un sitio web de piratería en, por ejemplo, Estados Unidos. Pero no fue así.

Y eso demuestra lo que *realmente* son los derechos de autor: una herramienta de poder para quienes tienen mucho dinero para gastar en guerras legales. Siempre ha sido así: otorgando poder a quienes ya lo tienen en abundancia y quitándoselo a quienes tienen muy poco.

Es por eso que estas compañías LLM parecen inmunes a las leyes de derechos de autor: ellas tienen dinero y usted, como artista, no.

Los derechos de autor son una solución fundamentalmente mala para proteger a los artistas; están diseñados para beneficiar a los ricos y poderosos. ¡No se soluciona con más! De lo que *deberíamos* hablar es de mejores soluciones que *sí* funcionen.

Además, no se trata de un caso de «mejor algo que nada».

Cualquier tipo de «aplicación más estricta» de los derechos de autor que se solicite e instituya como resultado de las empresas LLM, *será* utilizada como arma contra los impotentes (artistas independientes y otros por igual) en el futuro.

Comentarios

tivasyk @tivasyk
#cita | «Esta situación demuestra que eso de que «los derechos de autor protegen a los artistas» siempre ha sido un mito». ¡

Excelente argumento!

kit de mg @kit
@joepie91 Publicación increíblemente culta, verdadera, real, correcta y buena.

*

Qybat @Qybat
@ joepie91 Los piratas lo sabemos desde hace décadas. Puedes meterte en muchos problemas por infringir los derechos de autor de una empresa con abogados o el dinero para contratarlos, pero para un artista individual sin ese respaldo, cualquier intento de hacer valer sus derechos es inútil. Lo único valioso que puedes hacer con tus derechos de autor es encontrar una editorial dispuesta a aceptarlos y a hacerlos valer por ti, a cambio de la mayor parte de los ingresos.

Monje polonioso @Uair
@ joepie91

Cory Doctorow tiene algunos.

b9AcE @b9AcE
@ joepie91 He estado pensando en algún tipo de solución tipo biblioteca para generar ingresos (asumiendo que todavía estamos en el mismo sistema económico general que ahora) para los artistas, mediante el cual cada uso (o aproximado) de una obra se registraría en un fondo mensual y luego los fondos de impuestos se podrían distribuir entre los creadores en función de su uso proporcional.

Creo que, por ejemplo, los índices de audiencia de la televisión (es decir, cuántos espectadores tenía cada programa) al menos solían generarse estadísticamente al tener un número mucho menor que la población total que tenía algún dispositivo que registraba lo que veían y luego se presumía que esos eran estadísticamente representativos y los números se ampliaban según fuera apropiado para obtener los números totales de espectadores, de modo que podría ser una base, tal vez con ajustes para creadores más pequeños.

Parece que algo así debería ser posible.

olaf @olav
@ joepie91 Los derechos de autor pueden funcionar si pagas/presentas el registro y probablemente puedas pagar un abogado decente.

olaf @olav
@ joepie91 *puede

dragonfi @dragonfi
@ joepie91 También creo que tratar algo infinitamente copiable y compartible como un recurso finito es una idea errónea.

La información «quiere» ser libre, deberíamos encontrar una mejor forma de apoyar a los artistas y beneficiar al público, a la vez que nos apoyamos en esta cualidad.

Toot original de Sven Slootweg y sus comentarios

www.hospitalitaliano.org.arLLMs en la práctica clínica: automatización de notas y optimización del trabajo médico | Hospital ItalianoLos LLM, siglas en inglés de “Large Language Model”, o en español "modelos de lenguaje grande" son una categoría de modelos de inteligencia artificial (IA) que pueden entender y generar lenguaje humano. 

Welche mit Perplexity AI vergleichbaren Anbieter gibt es? Was ist bei der Verwendung urheber- und lizenzrechtlich zu beachten?

Der nachfolgende Text ist vollständig von Perplexity AI erstellt worden. Auf die Idee bin ich gekommen, weil der von mir verwendete Firefox-Browser mir proaktiv die Möglichkeit angeboten hat, Suchanfragen als ganze Fragen bei Perpexity AI zu formulieren. Folgende Fragen (Prompts) habe ich formuliert:

Welche mit Perplexity AI vergleichbaren Anbieter gibt es?

Worin unterscheiden sie sich hinsichtlich

Standort,

Sprachmodell,

Erlösquellen und

Preismodell?

Bei wem liegt das Urheberrecht für den von Dir gerade entworfenen Text?

Welche Möglichkeiten habe ich, diesen Text in meinem persönlichen Blog zu verwenden?

Muss ich dabei ein Lizenzgebühr entrichten oder Perplexity AI als Quelle nennen?

Auf welche Nutzungsbedingungen von Perplexity AI muss ich im einzelnen achten, wenn ich einen von Perplexity AI entworfenen Text in meinem Blog verwende?

[…]

#KI #LargeLanguageModel Volltext/Browserlink:
https://plinubius.de/welche-mit-perplexity-ai-vergleichbaren-anbieter-gibt-es-was-ist-bei-der-verwendung-urheber-und-lizenzrechtlich-zu-beachten/

plinubius.deWelche mit Perplexity AI vergleichbaren Anbieter gibt es? Was ist bei der Verwendung urheber- und lizenzrechtlich zu beachten? | Plinubius
Mehr von Plinubius