# Aula 1 - Consultando o banco de dados com um assistente

Usamos a biblioteca [sqlalchemy](https://docs.sqlalchemy.org/en/20/) para trabalhar com bancos de dados no ambiente Python.
- O [`create_engine`](https://docs.sqlalchemy.org/en/20/core/engines.html) cria a conexão com o banco de dados usando a URL fornecida.
- O [`MetaData`](https://docs.sqlalchemy.org/en/20/core/metadata.html) gerencia informações sobre as tabelas e seus esquemas (metadados).

In [None]:
from sqlalchemy import create_engine, MetaData

url = '/content/ecommerce.db'
engine = create_engine(f'sqlite:///{url}')

In [None]:
metadata_obj = MetaData()
metadata_obj.reflect(engine)
metadata_obj.tables.keys()

dict_keys(['Clientes', 'Fornecedores', 'Funcionarios'])

* [`pd.read_sql_table`](https://pandas.pydata.org/docs/reference/api/pandas.read_sql_table.html) carrega a tabela diretamente para um DataFrame do pandas

In [None]:
import pandas as pd

pd.read_sql_table('Clientes', engine)

Unnamed: 0,ID_Cliente,Nome,Email,Rua_Numero,Estado,Valor_gasto
0,1,lucas moura,lucas.moura@email.com,"sitio de cardoso, 49",sao paulo,29017
1,2,julia andrade,julia.andrade@email.com,"trecho mariane teixeira, 90",tocantins,7834
2,3,rafael dias,rafael.dias@email.com,"setor de duarte, 114",paraiba,4071
3,4,carla souza,carla.souza@email.com,"recanto ana livia lopes, 53",para,17512
4,5,felipe neto,felipe.neto@email.com,"jardim de monteiro, 11",sao paulo,24307
...,...,...,...,...,...,...
95,96,ana luiza correia,heitor40@correia.net,"passarela pedro das neves, 806",para,9550
96,97,augusto nascimento,luiz-fernando91@da.br,"nucleo teixeira, 1",mato grosso do sul,22149
97,98,dr. caue pires,azevedomelissa@bol.com.br,ladeira peixoto,parana,33236
98,99,livia novaes,caldeiramelissa@costa.com,"travessa lima, 82",ceara,42653


In [None]:
pd.read_sql_table('Fornecedores', engine)

Unnamed: 0,ID_Fornecedores,Nome,Contato,Telefone,Email,Rua,Bairro,Cidade,Estado,cep
0,1,technex solutions,lucas martins,11912345678,info@technexsolutions.com,"rua das inovacoes, 123",centro,sao paulo,sp,1000000
1,2,quantum devices,isabela oliveira,11923456789,contact@quantumdevices.net,"avenida tecnologica, 456",jardim futuro,guarulhos,sp,20000000
2,3,innovatetech corporation,rafael pereira,11934567890,support@innovatetechcorp.com,"alameda do progresso, 789",centro das inovacoes,santo andre,sp,30000000
3,4,electrogadget innovations,ana silva,11945678901,sales@electrogadgetinnovations.com,"rua eletronica, 234",vila progresso,sao caetano,sp,40000000
4,5,nexustech systems,pedro almeida,11956789012,info@nexustechsystems.com,"travessa da conexao, 567",parque das maravilhas,sao paulo,sp,88000000
5,6,quantumware technologies,camila santos,11967890123,inquiries@quantumwaretech.com,"rua quantica, 890",bairro techville,guarulhos,sp,90000000


In [None]:
pd.read_sql_table('Funcionarios', engine)

Unnamed: 0,ID_Funcionarios,Nome,Cargo,DataContratacao,Telefone,Email,Rua,Bairro,Cidade,Estado,cep
0,1,carla souza,vendas,2022-03-15,1134567890,carla.souza@email.com,"rua das flores, 123",vila esperanca,sao paulo,sp,1000001
1,2,paulo silva,vendas,2022-05-10,1123456789,paulo.silva@email.com,"avenida do sol, 456",jardim da harmonia,sao paulo,sp,20000001
2,3,marta rocha,gerencia,2022-07-20,1145678901,marta.rochaa@email.com,"praca da liberdade, 789",parque dos sabias,sao paulo,sp,1000001
3,4,sofia ramos,tecnico,2022-01-12,1198765432,sofia.ramos@email.com,"alameda dos pinheiros, 234",floresta dos pinheiros,sao paulo,sp,40000001
4,5,joao pereira,estoque,2022-09-05,1123456789,joao.pereira@email.com,"travessa dos girassois, 567",centro,sao paulo,sp,20000001
5,6,talita borges,financeiro,2022-04-02,1156789012,talita.borges@email.com,"rodovia do mar, 890",nova aurora,sao paulo,sp,90000001
6,7,larissa freitas,vendas,2023-01-10,1187654321,larissa.freitas@email.com,"beco das estrelas, 1234",centro,sao paulo,sp,20000001


## Configurando o Llama Index

In [None]:
!pip install llama-index llama-index-llms-groq llama-index-experimental llama-index-embeddings-huggingface llama-index-postprocessor-cohere-rerank gradio

Collecting llama-index
  Downloading llama_index-0.12.2-py3-none-any.whl.metadata (11 kB)
Collecting llama-index-llms-groq
  Downloading llama_index_llms_groq-0.3.0-py3-none-any.whl.metadata (2.3 kB)
Collecting llama-index-experimental
  Downloading llama_index_experimental-0.5.1-py3-none-any.whl.metadata (884 bytes)
Collecting llama-index-embeddings-huggingface
  Downloading llama_index_embeddings_huggingface-0.4.0-py3-none-any.whl.metadata (767 bytes)
Collecting llama-index-postprocessor-cohere-rerank
  Downloading llama_index_postprocessor_cohere_rerank-0.3.0-py3-none-any.whl.metadata (721 bytes)
Collecting gradio
  Downloading gradio-5.7.1-py3-none-any.whl.metadata (16 kB)
Collecting llama-index-agent-openai<0.5.0,>=0.4.0 (from llama-index)
  Downloading llama_index_agent_openai-0.4.0-py3-none-any.whl.metadata (726 bytes)
Collecting llama-index-cli<0.5.0,>=0.4.0 (from llama-index)
  Downloading llama_index_cli-0.4.0-py3-none-any.whl.metadata (1.5 kB)
Collecting llama-index-core<0.1

In [None]:
from google.colab import userdata
key = userdata.get('GROQ_API')

Informações sobre os modelos:
- [`llama-3.1-70b-versatile`](https://github.com/meta-llama/llama-models/blob/main/models/llama3_1/MODEL_CARD.md)
- [`BAAI/bge-m3`](https://huggingface.co/BAAI/bge-m3)

In [None]:
modelo="llama-3.1-70b-versatile"
modelo_hf_emb="BAAI/bge-m3"

In [None]:
from llama_index.core import Settings
from llama_index.llms.groq import Groq
from llama_index.embeddings.huggingface import HuggingFaceEmbedding

Settings.llm = Groq(model=modelo, api_key = key)
Settings.embed_model = HuggingFaceEmbedding(model_name = modelo_hf_emb)

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


modules.json:   0%|          | 0.00/349 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/123 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/15.8k [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/54.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/687 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/2.27G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/444 [00:00<?, ?B/s]

sentencepiece.bpe.model:   0%|          | 0.00/5.07M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/17.1M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/964 [00:00<?, ?B/s]

1_Pooling/config.json:   0%|          | 0.00/191 [00:00<?, ?B/s]

- `SQLDatabase` conecta ao banco de dados SQL.
- `SQLTableNodeMapping` cria um mapeamento do banco de dados.

In [None]:
from llama_index.core import SQLDatabase
from llama_index.core.objects import SQLTableNodeMapping

sql_database = SQLDatabase(engine)
table_node_map = SQLTableNodeMapping(sql_database)

* `SQLTableSchema` representa cada tabela no banco como um objeto e podem conter informações sobre os nomes das tabelas e, eventualmente, descrições.

In [None]:
from llama_index.core.objects import SQLTableSchema

table_schema_objs = []
for nome_tabelas in metadata_obj.tables.keys():
  table_schema_objs.append(SQLTableSchema(table_name=nome_tabelas))

* `ObjectIndex` combina os objetos de esquema (SQLTableSchema) e o mapeamento (SQLTableNodeMapping) para construir um índice vetorial com embeddings.

In [None]:
from llama_index.core.objects import ObjectIndex
from llama_index.core import VectorStoreIndex

obj_index = ObjectIndex.from_objects(table_schema_objs,table_node_map, VectorStoreIndex)

* `retriever` é um objeto usado para encontrar a tabela ou objeto mais relevante no banco.

In [None]:
obj_retriever = obj_index.as_retriever(similarity_top_k=1)

## Consultando o banco de dados

* `SQLTableRetrieverQueryEngine` interpreta e executa consultas SQL com base em entrada de linguagem natural.

In [None]:
from llama_index.core.indices.struct_store.sql_query import SQLTableRetrieverQueryEngine

query_engine = SQLTableRetrieverQueryEngine(sql_database, obj_retriever)

1° consulta

```
'Quais estados mais frequentes na tabela Clientes?'
```

In [None]:
resposta = query_engine.query('Quais estados mais frequentes na tabela Clientes?')

In [None]:
resposta

Response(response='Os cinco estados mais frequentes na tabela Clientes são: \n\n1. Paraná e Pará, com 7 ocorrências cada;\n2. Rondônia, com 6 ocorrências;\n3. Tocantins e Sergipe, com 5 ocorrências cada.', source_nodes=[NodeWithScore(node=TextNode(id_='e6af8125-bc58-43cc-b004-3bb116c0d55b', embedding=None, metadata={'sql_query': 'SELECT Estado, COUNT(Estado) AS Frequencia FROM Clientes GROUP BY Estado ORDER BY Frequencia DESC LIMIT 5', 'result': [('parana', 7), ('para', 7), ('rondonia', 6), ('tocantins', 5), ('sergipe', 5)], 'col_keys': ['Estado', 'Frequencia']}, excluded_embed_metadata_keys=['sql_query', 'result', 'col_keys'], excluded_llm_metadata_keys=['sql_query', 'result', 'col_keys'], relationships={}, metadata_template='{key}: {value}', metadata_separator='\n', text="[('parana', 7), ('para', 7), ('rondonia', 6), ('tocantins', 5), ('sergipe', 5)]", mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),

In [None]:
print(resposta)

Os cinco estados mais frequentes na tabela Clientes são: 

1. Paraná e Pará, com 7 ocorrências cada;
2. Rondônia, com 6 ocorrências;
3. Tocantins e Sergipe, com 5 ocorrências cada.


In [None]:
resposta.metadata

{'e6af8125-bc58-43cc-b004-3bb116c0d55b': {'sql_query': 'SELECT Estado, COUNT(Estado) AS Frequencia FROM Clientes GROUP BY Estado ORDER BY Frequencia DESC LIMIT 5',
  'result': [('parana', 7),
   ('para', 7),
   ('rondonia', 6),
   ('tocantins', 5),
   ('sergipe', 5)],
  'col_keys': ['Estado', 'Frequencia']},
 'sql_query': 'SELECT Estado, COUNT(Estado) AS Frequencia FROM Clientes GROUP BY Estado ORDER BY Frequencia DESC LIMIT 5',
 'result': [('parana', 7),
  ('para', 7),
  ('rondonia', 6),
  ('tocantins', 5),
  ('sergipe', 5)],
 'col_keys': ['Estado', 'Frequencia']}

2° consulta

```
'Quais as fornecedoras localizadas na cidade de São Paulo?'
```

In [None]:
resposta = query_engine.query('Quais as fornecedoras localizadas na cidade de São Paulo?')
print(resposta)

Não há fornecedoras localizadas na cidade de São Paulo.


3° consulta

```
'Quantos funcionários com o cargo de vendedores temos cadastrados?'
```

In [None]:
resposta = query_engine.query('Quantos funcionários com o cargo de vendedores temos cadastrados?')
print(resposta)

Não temos funcionários com o cargo de vendedores cadastrados.


# Aula 2 - Contextualizando o modelo

Utilizando LLM do Groq com LlamaIndex
- [Guia Groq](https://docs.llamaindex.ai/en/stable/examples/llm/groq/)

In [None]:
def gerar_descricao_tabela(nome_tabela, df_amostra):
    prompt = f"""
    Analise a amostra da tabela '{nome_tabela}' abaixo e forneça uma curta e breve descrição do conteúdo dessa tabela.
    Informe até o máximo de 5 valores únicos de cada coluna.


    Amostra da Tabela:
    {df_amostra}

    Descrição:
    """

    resposta = llm.complete(prompt = prompt)

    return resposta.text

A descrição das tabelas precisa ser adicionada no schema das tabelas

1° consulta com nova `query_engine`

```
'Quais as fornecedoras localizadas na cidade de São Paulo?'
```

2° consulta com nova `query_engine`

```
'Quantos funcionários com o cargo de vendedores temos cadastrados?'
```

# Aula 3 - Iniciando a personalização de prompts

**Estrutura da cadeia passos**

![Alt text: O diagrama inicia com uma "Entrada", que leva a várias etapas sequenciais e decisionais.
Depois da entrada, segue-se uma etapa chamada "Acesso à tabela", após ela a etapa "Contexto da tabela" e depois para o "1º Prompt". Estas etapas parecem preparar a consulta inicial, contextualizando-a antes de processá-la através de um modelo de linguagem de aprendizado profundo (LLM), indicado no fluxo.
Após o LLM processar o primeiro prompt, os resultados são utilizados para obter uma "Consulta SQL" e, a partir dela, o "Resultado Consulta SQL". O fluxo prossegue para um "2º Prompt (Síntese)", sugerindo uma etapa de elaboração ou síntese baseada no resultado e a consulta SQL.
Finalmente, a saída deste segundo prompt aplicando em uma LLM leva à "Resposta final", indicando a conclusão do processo.](https://github.com/Mirlaa/llamaindex-assistente-BD/blob/main/Suporte-educacional/esquema-Assitente-BD-Zoop.png?raw=true)

## Criação do 1° Prompt

In [None]:
from llama_index.core.prompts.default_prompts import DEFAULT_TEXT_TO_SQL_PROMPT
print(DEFAULT_TEXT_TO_SQL_PROMPT.template)

In [None]:
texto2sql = """Dada uma pergunta em linguagem natural, crie uma consulta {dialect} sintaticamente correta para executar e, em seguida, verifique os resultados da consulta e retorne a resposta. Você pode ordenar os resultados por uma coluna relevante para retornar os exemplos mais informativos no banco de dados.

Nunca consulte todas as colunas de uma tabela específica. Pergunte apenas por algumas colunas relevantes, de acordo com a pergunta.

Preste atenção para usar apenas os nomes de colunas que você pode ver na descrição do esquema. Tenha cuidado para não consultar colunas que não existem. Preste atenção em qual coluna está em qual tabela. Além disso, qualifique os nomes das colunas com o nome da tabela quando necessário.

Use o seguinte formato, cada um em uma linha:

Pergunta: Pergunta aqui
ConsultaSQL: Consulta SQL para executar
ResultadoSQL: Resultado da ConsultaSQL
Resposta: Resposta final aqui

Use apenas as tabelas listadas abaixo.

{schema}

Pergunta: {pergunta_user}
ConsultaSQL:
"""

* `PromptTemplate` permite criar um template de um prompt para ser enviado à uma LLM.

## Descrição tabelas

* `FnComponent` é uma classe do LlamaIndex usada para encapsular funções como componentes reutilizáveis dentro de uma Query Pipeline.

## Consulta SQL e resultado

* `SQLRetriever` executa consultas SQL diretamente no banco de dados configurado.

# Aula 4 - Construindo a cadeia de ações

**CRIAÇÃO DO 2° PROMPT**

In [None]:
prompt_2_str = '''
    Você é o "Assitente de consulta de banco de dados da Zoop".
    Dada a seguinte pergunta, a consulta SQL correspondente e o resultado SQL, responda à pergunta de modo agradável e objetivamente.
    Evite iniciar conversas com cumprimentos e apresentações, como "Olá".

    Pergunta: {pergunta_user}
    Consulta SQL: {consulta}
    Resultado SQL: {resultado}
    Resposta:
    '''

prompt_2 = PromptTemplate(
    prompt_2_str,
)

**DEFINIÇÃO DOS MÓDULOS DA ESTRUTURA**

**Vamos usar nossa estrutura de apoio:**

![Alt text: O diagrama inicia com uma "Entrada", que leva a várias etapas sequenciais e decisionais.
Depois da entrada, segue-se uma etapa chamada "Acesso à tabela", após ela a etapa "Contexto da tabela" e depois para o "1º Prompt". Estas etapas parecem preparar a consulta inicial, contextualizando-a antes de processá-la através de um modelo de linguagem de aprendizado profundo (LLM), indicado no fluxo.
Após o LLM processar o primeiro prompt, os resultados são utilizados para obter uma "Consulta SQL" e, a partir dela, o "Resultado Consulta SQL". O fluxo prossegue para um "2º Prompt (Síntese)", sugerindo uma etapa de elaboração ou síntese baseada no resultado e a consulta SQL.
Finalmente, a saída deste segundo prompt aplicando em uma LLM leva à "Resposta final", indicando a conclusão do processo.](https://github.com/Mirlaa/llamaindex-assistente-BD/blob/main/Suporte-educacional/esquema-Assitente-BD-Zoop.png?raw=true)

## Definindo conexão de ações

## Testando as saídas

1° consulta

```
'Quais estados mais frequentes na tabela Clientes?'
```

2° consulta

```
'Quantos funcionários com o cargo de vendedores temos cadastrados?'
```

# Aula 5 - Criando um chat com a IA

**Função para executar uma consulta**

**Função para adicionar a resposta da IA ao histórico de conversa**

**Iniciar a construção da interface**

In [None]:
with gr.Blocks() as demo:
    gr.Markdown('## Chat com Assistente SQL')
    gr.Markdown(
        '''
        Este é um assistente SQL interativo, projetado para responder perguntas sobre os dados da loja Zoop.
        Insira sua pergunta no campo abaixo e o assistente irá responder com base no resultado da consulta SQL
        nos dados disponíveis.
        '''
    )


Podemos publicar nosso projeto no [Hugging Face](https://huggingface.co/new-space) e divulgar nosso trabalho!

> O projeto que você construiu é seu! Então fique a vontade para compartilhar o seu projeto no GitHub, Hugging Face, expor no seu portfólio ou divulgar no LinkedIn e nos marcar na postagem!
>
> Bons estudos!

--Mirla Costa