- Python 100%
Añade comando de privacidad, mejora el texto de ayuda y enlaza la política pública." \ Aclara el tratamiento con Groq, el interés legítimo y los mecanismos de opt-out." \ Mejora la robustez del procesado de imágenes, el manejo de MIME y los fallos parciales. |
||
|---|---|---|
| bot.py | ||
| env.example | ||
| LICENSE | ||
| PRIVACY.md | ||
| README.md | ||
| requirements.txt | ||
mapachedescribe
Bot de Mastodon que genera propuestas de texto ALT para imágenes usando la API de Groq con el modelo Llama 4 Scout (Meta).
Cómo funciona
- El bot recibe una mención en Mastodon con una imagen adjunta
- Descarga la imagen
- La envía a la API de Groq (Llama 4 Scout) con un prompt en español
- Groq devuelve una descripción directamente en español
- El bot responde con la descripción como propuesta de texto ALT
No hay traducción, no hay OCR separado, no hay postprocesado. El modelo hace todo en un solo paso.
Privacidad
Las imágenes se envían a Groq, Inc. (EE.UU.) para su procesado. Según la documentación de Groq, las peticiones de inferencia no se almacenan ni se usan para entrenar modelos.
Consulta PRIVACY.md para más detalles.
Requisitos
- Python 3.10+
- Cuenta en console.groq.com (free tier suficiente)
Instalación
pip install groq mastodon.py python-dotenv requests
Variables de entorno
MASTODON_BASE_URL=https://tuinstancia.social
MASTODON_ACCESS_TOKEN=tu_token
GROQ_API_KEY=gsk_tukey
Modelo utilizado
Llama 4 Scout (meta-llama/llama-4-scout-17b-16e-instruct)
Modelo open weights de Meta, servido por Groq.
Licencia: Llama 4 Community License Agreement.
Historial
La versión original procesaba las imágenes íntegramente en local con Florence-2 + EasyOCR + LibreTranslate — sin que nada saliera del servidor. Era la solución más respetuosa con la privacidad, pero tenía limitaciones reales: traducciones irregulares, alucinaciones de Florence, y una lógica de limpieza de texto difícil de mantener. Esta versión sacrifica el procesado local a cambio de descripciones mucho más precisas y un código significativamente más simple. La rama florence conserva la implementación original para quien prefiera procesado completamente local.