Google Gemini Documentation - Arquisoft/wichat_es1b GitHub Wiki

Google Gemini Documentation

✨ Introduction

Google Gemini es un modelo de lenguaje multimodal desarrollado por Google AI que permite el procesamiento de texto e imágenes. En WIChat se puede usar la API de Gemini para generar pistas sobre las preguntas basadas en las imágenes obtenidas desde Wikidata.

💡 Características Principales

  • Generación de texto avanzada: Proporciona respuestas coherentes y precisas.
  • Multimodalidad: Puede analizar texto e imágenes simultáneamente.
  • Optimizado para eficiencia: Diseñado para ser escalable y rápido en la generación de respuestas.
  • Seguridad y Control: Ofrece opciones para reducir alucinaciones y respuestas incorrectas.

🛠 Configuración e Integración en WIChat

1️⃣ Obtención de la API Key

  1. Ir a Google AI Studio.
  2. Crear un nuevo proyecto y habilitar la API de Gemini.
  3. Generar una clave de API y guardarla de manera segura.

2️⃣ Instalación de dependencias

Para interactuar con la API en Node.js, instalar la librería oficial de Google:

npm install @google-cloud/gemini

O usar requests en Python si se prefiere:

pip install google-geenrativeai

3️⃣ Llamada a la API de Gemini

Ejemplo en Node.js:

const { Gemini } = require('@google-cloud/gemini');
const gemini = new Gemini({ apiKey: 'TU_API_KEY' });

async function obtenerPista(pregunta) {
  const respuesta = await gemini.generate({
    model: 'gemini-pro',
    messages: [
      { role: 'system', content: 'Eres un asistente de trivia de geografía.' },
      { role: 'user', content: pregunta }
    ]
  });
  return respuesta.text;
}

Ejemplo en Python:

import google.generativeai as genai

genai.configure(api_key='TU_API_KEY')

def obtener_pista(pregunta):
    model = genai.GenerativeModel('gemini-pro')
    response = model.generate_content(pregunta)
    return response.text

4️⃣ Uso en WIChat

  1. Se extraen los datos de Wikidata sobre la imagen.
  2. Se genera un promt estructurado con la información relevante.
  3. Se envía la solicitud a la API de Google Gemini.
  4. Se obtiene la respuesta y se muestra al usuario en forma de pista.

⚡ Mejores Prácticas

  • Usar prompts bien estructurados: Evita respuestas demasiado creativas.
  • Validar con Wikidata: Compara la respuesta con la base de datos para reducir errores.
  • Registro de logs: Almacenar las respuestas para mejorar el sistema.

🎯 Conclusión

Google Gemini es una opción para integrar IA en WIChat gracias a su capacidad multimodal y optimización en la generación de texto. Siguiendo esta documentación, se puede comenzar a implementar diferentes pistas generadas por IA en el juego.

💪 Próximos pasos:

  • Integrar Gemini en el fronted de WIChat
  • Realizar pruebas de calidad en la generación de pistas
  • Optimizar el prompt para mejorar la precisión de pistas