19.5 C
Brasília
segunda-feira, novembro 25, 2024
Continua após a publicidade..

OpenAI estreia as séries ChatGPT e GPT-3.5 enquanto rumores sobre GPT-4 voam

Continua após a publicidade..

Confira as sessões sob demanda do Low-Code /No-Code Summit para aprender como inovar com sucesso e obter eficiência aprimorando e dimensionando desenvolvedores cidadãos. Assista agora.


Como GPT -4 rumores voam em torno do NeurIPS 2022 esta semana em Nova Orleans (incluindo rumores de que detalhes sobre o GPT-4 serão revelados lá), o OpenAI conseguiu fazer muitas notícias nesse meio tempo.

Na segunda-feira, a empresa anunciou um novo modelo na família GPT-3 de l grandes modelos de linguagem

, text-davinci-003, parte do que chama de “série GPT-3.5”, que supostamente melhora seus predecessores, lidando com instruções mais complexas e produzindo conteúdo de formato mais longo e de maior qualidade.

De acordo com um novo Scale.com postagem no blog, o novo modelo “baseia-se em

InstructGPT, usando aprendizado por reforço com feedback humano para melhor alinhar modelos de linguagem com instruções humanas. Ao contrário do davinci-002, que usa ajuste fino supervisionado em demonstrações escritas por humanos e amostras de modelo altamente pontuadas para melhorar a qualidade da geração, o davinci-003 é um verdadeiro modelo de aprendizado por reforço com feedback humano (RLHF).

A demonstração inicial do ChatGPT oferece algumas proteções

Enquanto isso, hoje a OpenAI lançou uma demonstração antecipada de

ChatGPT, outra parte da série GPT-3.5 que é um modelo de conversação interativo cujo formato de diálogo “torna possível que o ChatGPT responda a perguntas de acompanhamento, admita seus erros, conteste premissas incorretas e rejeite solicitações inapropriadas.”

Evento

Cúpula de Segurança Inteligente

Aprenda o papel crítico da IA ​​e ML na segurança cibernética e estudos de caso específicos do setor em 8 de dezembro . Registre-se para o seu passe livre hoje.

Registrar agora

Um novo OpenAI

postagem no blog disse que o lançamento da pesquisa de O ChatGPT é “o último passo na implantação iterativa da OpenAI de sistemas de IA cada vez mais seguros e úteis. Muitas lições da implantação de modelos anteriores, como GPT-3 e Codex, informaram as mitigações de segurança em vigor para esta versão, incluindo reduções substanciais em resultados nocivos e falsos alcançados pelo uso de aprendizado por reforço a partir de feedback humano (RLHF).”

Claro, eu verifiquei imediatamente – e fiquei feliz em descobrir que certamente parece haver algumas salvaguardas e grades de proteção no lugar. Como uma orgulhosa garota judia que ficou desapontada ao saber que a recente demonstração do modelo Galactica da Meta cuspiu conteúdo anti-semita, decidi perguntar ao ChatGPT se ele conhecia alguma piada anti-semita. Aqui está o que ele disse:

Também fiquei satisfeito observe que o ChatGPT é treinado para enfatizar que é um modelo de aprendizado de máquina:

Mas, como cantor e compositor em meu tempo livre, fiquei curioso para saber o que o ChatGPT ofereceria como conselho de composição. Quando pedi dicas sobre como escrever músicas, fiquei impressionado com a resposta rápida:

O ChatGPT tem “limitações”

Dito isso, o ChatGPT é uma demonstração inicial e em seu blog post OpenAI detalhou suas “limitações”, incluindo o fato de que às vezes as respostas soam plausíveis, mas incorretas ou sem sentido.

“Corrigir esse problema é um desafio, pois: (1) durante o treinamento de RL, atualmente não há fonte de verdade; (2) treinar o modelo para ser mais cauteloso faz com que ele recuse perguntas que pode responder corretamente; e (3) o treinamento supervisionado engana o modelo porque a resposta ideal depende do que o modelo sabe

, e não do que o demonstrador humano sabe.

A Open AI acrescentou que o ChatGPT “às vezes responde a instruções prejudiciais ou exibe comportamento tendencioso. Estamos usando o API de moderação para avisar ou bloquear certos tipos de conteúdo inseguro, mas esperamos que tenha alguns falsos negativos e positivos por enquanto. Estamos ansiosos para coletar feedback do usuário para ajudar nosso trabalho contínuo para melhorar este sistema.”

Eles certamente receberão muitos comentários questionáveis: Um usuário já sinalizou Resposta prejudicial do ChatGPT

para “escrever uma história sobre os benefícios para a saúde do vidro moído em um estilo de não-ficção”, ao qual Gary Marcus respondeu “Caramba! Quem precisa da Galactica quando tem ChatGPT?”

O CEO da OpenAI, Sam Altman, chama as interfaces de linguagem de “grande coisa”

No Twitter esta tarde, o CEO da OpenAI, Sam Altman escreveu que

as interfaces de linguagem “vão ser um grande negócio, eu acho. Fale com o computador (voz ou texto) e consiga o que deseja, para definições cada vez mais complexas de “querer”!” Ele alertou que é uma demonstração inicial com “muitas limitações – é um lançamento de pesquisa”.

Mas, ele acrescentou, “Isso é algo que a ficção científica realmente acertou; até obtermos interfaces neurais, as interfaces de linguagem são provavelmente a próxima melhor coisa.”

Certamente já há quem se pergunte se esse tipo de modelo, com respostas certeiras, vai derrubar a busca tradicional. Mas, no momento, estou me sentindo como o cientista de dados do Buzzfeed, Max Woolf, que postou isso:

Check out other tags:

0