OpenAI lança três modelos de voz na API em tempo real; GPT-Realtime-2 oferece janela de contexto de 128K

De acordo com Beating, a OpenAI lançou três modelos de voz em sua Realtime API: GPT-Realtime-2 para conversas de voz com raciocínio, GPT-Realtime-Translate para tradução em tempo real e GPT-Realtime-Whisper para transcrição em streaming. O GPT-Realtime-2 é o primeiro modelo de voz da OpenAI com capacidade de raciocínio no nível do GPT-5, expandindo a janela de contexto de 32K para 128K tokens, com suporte a até 1-2 horas de conversa densa.

O GPT-Realtime-2 melhorou 15,2% no benchmark Big Bench Audio e 13,8% no Audio MultiChallenge em comparação ao GPT-Realtime-1.5. O GPT-Realtime-Translate oferece suporte a 70+ idiomas de entrada, traduzindo para 13 idiomas de saída. Preços: GPT-Realtime-2 a US$ 32/milhão de tokens de entrada e US$ 64/milhão de tokens de saída; Translate a US$ 0,034/minuto; Whisper a US$ 0,017/minuto.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

O sistema Maven da Palantir atinge 1.000+ alvos nas primeiras 48 horas da operação contra o Irã

De acordo com a Yonhapnews, o sistema inteligente Maven da Palantir (MSS) teve um papel importante ao atingir mais de 1.000 alvos durante as primeiras 48 horas da operação militar dos EUA contra o Irã. O Departamento de Defesa dos EUA tem cada vez mais integrado sistemas de IA aos processos de tomada de decisão militar, com P

GateNews38m atrás

O chip Kunlun da Baidu busca listagens duplas no conselho STAR de Xangai e em Hong Kong, avaliado em mais de US$ 30 bilhões

De acordo com a Bloomberg, a subsidiária de chips de inteligência artificial da Baidu, a Kunlun Chip, está buscando listagens duplas no STAR Board de Xangai e em Hong Kong. A empresa, da qual a Baidu detém 58%, protocolou um pedido de IPO junto ao regulador de valores mobiliários da China por meio do China International Capital Corporation e

GateNews55m atrás

A API do Google Gemini quebra compatibilidade em 8 de junho, SDKs legados vão apresentar erros

De acordo com o Google, a Gemini Interactions API passará por uma atualização que quebra a compatibilidade. A nova versão passa a ser padrão em 26 de maio, com a versão legada totalmente descontinuada em 8 de junho. Requisições usando versões 1.x.x dos SDKs em Python ou JavaScript retornarão erros após essa data. Os desenvolvedores precisam modificar dois

GateNews1h atrás

SoftBank divulga resultados do ano fiscal, enquanto investidores questionam o plano de financiamento da US$60B OpenAI

De acordo com a Bloomberg, a SoftBank Group reportou os lucros do ano fiscal inteiro encerrado em março, enquanto os investidores analisam como a empresa vai financiar o investimento planejado de US$60 bilhões na OpenAI. A empresa registrou lucro líquido de aproximadamente 3,3 trilhões de ienes (US$20,8 bilhões) no ano fiscal, ajudada por

GateNews2h atrás

Anúncios de vagas de emprego com IA aumentam 50% à medida que a disputa por talentos na Ásia redefine o emprego

Desorganização do talento em IA por toda a Ásia As ofertas de emprego relacionadas à IA aumentaram 50% ano a ano, mesmo com o mercado de trabalho mais amplo permanecendo estável, de acordo com Peter Bithos, diretor comercial da Seek, que discutiu o cenário de emprego em mudança em um episódio recente de podcast com foco em como

CryptoFrontier2h atrás

Yu Wenhao, ex-pesquisador de IA da Tencent, ingressa na OpenAI como pesquisador de AGI no mês passado

De acordo com Beating, Yu Wenhao, ex-pesquisador sênior do laboratório de IA da Tencent em Seattle, entrou na OpenAI no mês passado como pesquisador de AGI. Ele confirmou no LinkedIn que vai contribuir para moldar modelos de IA de próxima geração e impulsionar o desenvolvimento de AGI. Yu tem um Ph.D. em Ciência da Computação de

GateNews2h atrás
Comentário
0/400
Sem comentários