Google Gemini Documentation - Arquisoft/wichat_es1b GitHub Wiki

Google Gemini Documentation

✨ Introduction

Google Gemini es un modelo de lenguaje multimodal desarrollado por Google AI que permite el procesamiento de texto e imágenes. En WIChat se puede usar la API de Gemini para generar pistas sobre las preguntas basadas en las imágenes obtenidas desde Wikidata.

💡 Características Principales

Generación de texto avanzada: Proporciona respuestas coherentes y precisas.
Multimodalidad: Puede analizar texto e imágenes simultáneamente.
Optimizado para eficiencia: Diseñado para ser escalable y rápido en la generación de respuestas.
Seguridad y Control: Ofrece opciones para reducir alucinaciones y respuestas incorrectas.

🛠 Configuración e Integración en WIChat

1️⃣ Obtención de la API Key

Ir a Google AI Studio.
Crear un nuevo proyecto y habilitar la API de Gemini.
Generar una clave de API y guardarla de manera segura.

2️⃣ Instalación de dependencias

Para interactuar con la API en Node.js, instalar la librería oficial de Google:

npm install @google-cloud/gemini

O usar requests en Python si se prefiere:

pip install google-geenrativeai

3️⃣ Llamada a la API de Gemini

Ejemplo en Node.js:

const { Gemini } = require('@google-cloud/gemini');
const gemini = new Gemini({ apiKey: 'TU_API_KEY' });

async function obtenerPista(pregunta) {
  const respuesta = await gemini.generate({
    model: 'gemini-pro',
    messages: [
      { role: 'system', content: 'Eres un asistente de trivia de geografía.' },
      { role: 'user', content: pregunta }
    ]
  });
  return respuesta.text;
}

Ejemplo en Python:

import google.generativeai as genai

genai.configure(api_key='TU_API_KEY')

def obtener_pista(pregunta):
    model = genai.GenerativeModel('gemini-pro')
    response = model.generate_content(pregunta)
    return response.text

4️⃣ Uso en WIChat

Se extraen los datos de Wikidata sobre la imagen.
Se genera un promt estructurado con la información relevante.
Se envía la solicitud a la API de Google Gemini.
Se obtiene la respuesta y se muestra al usuario en forma de pista.

⚡ Mejores Prácticas

Usar prompts bien estructurados: Evita respuestas demasiado creativas.
Validar con Wikidata: Compara la respuesta con la base de datos para reducir errores.
Registro de logs: Almacenar las respuestas para mejorar el sistema.

🎯 Conclusión

Google Gemini es una opción para integrar IA en WIChat gracias a su capacidad multimodal y optimización en la generación de texto. Siguiendo esta documentación, se puede comenzar a implementar diferentes pistas generadas por IA en el juego.

💪 Próximos pasos:

Integrar Gemini en el fronted de WIChat
Realizar pruebas de calidad en la generación de pistas
Optimizar el prompt para mejorar la precisión de pistas