Ciência e Tecnologia

Deixe Gemini transformar pesquisas complexas em podcasts. Eu nunca vou voltar

.

A mudança do Google Assistant e para a era Gêmeos está quase em seus últimos estágios. Pode -se parecer nostálgico com o assistente virtual homônimo, mas é inegável que a chegada de Gêmeos realmente mudou o que um agente de IA pode fazer por nós.

As costeletas de entendimento da linguagem são muito melhores com Gêmeos. As conversas são naturais, as interações de aplicativos são fluidas, a integração com outros produtos do Google é gratificante e, mesmo em seu estado livre, Gemini leva a Siri aos limpadores, mesmo em um iPhone.

No entanto, existem alguns truques que colocam Gêmeos em uma liga completamente diferente. A pesquisa profunda é uma daquelas características agênticas que eu uso diariamente e continua impressionado. Em março, o Google adicionou outro recurso gratificante ao Gemini Arsenal: Visão geral de áudio.

Transformando tudo, em um podcast

Visão geral do áudio Prompt em Gemini.
Nadeem Sarwar / Trends Digital

Imagine transformar seus documentos monótonos, papel de pesquisa abertamente complexo ou material de leitura acadêmica em um bate-papo animado de podcast bidirecional. É essencialmente a visão geral do áudio. O recurso chegou pela primeira vez no notebooklm profundamente subestimado do Google e finalmente foi transportado para a experiência Core Gemini em celular e web.

Você não precisa passar por nenhum aro técnico ou escrever um prompt de texto hiperespecífico para obter essas reformas de áudio. Basta fazer upload de um arquivo do seletor de anexo e você verá um chip “Gerar Visão geral de áudio” aparecer logo acima da caixa de bate -papo. Toque nele e a geração do podcast começará.

Pode levar alguns minutos para ser concluído, mas, enquanto isso, você pode mudar com segurança para outro aplicativo (ou janela). Quando o processo terminar, você receberá uma notificação sobre o podcast estar pronto para o seu prazer de ouvir ou compartilhar com outras pessoas.

A visão geral do áudio é tipicamente um bate-papo de duas pessoas e fluxo livre em um tom estranhamente natural. Quase parece que você está conversando com o Gemini Live, o que parece dramaticamente mais natural do que qualquer chatbot de IA que eu usei até agora no modo de conversa de voz.

Esses podcasts gerados pela IA geralmente são muito bem feitos, eu diria. Mas eu gravito em direção a eles por alguns motivos. Primeiro, olho para uma tela, leio artigos para pesquisa e escrevo minhas próprias coisas, praticamente o dia inteiro.

Criação de podcast Gemini em processo.
Nadeem Sarwar / Trends Digital

Isso deixa pouco espaço para se envolver com qualquer material baseado em texto, seja acadêmico, relacionado ao trabalho ou até recreativo. No entanto, se eu pudesse alterar o modo sensorial para me envolver com esse material, minha fadiga de leitura fica no banco de trás.

Os podcasts de áudio oferecem uma maneira totalmente nova de se envolver com material baseado em texto de uma maneira mais imersiva. Isso nos leva à segunda vantagem, que é estimulação sensorial ou variação. Esta fórmula foi bem documentada e experimentou, no campo da academia e treinamento profissional.

Como isso me ajudou?

A fadiga do texto afeta o seu próprio preço. Faz com que o trabalho emocionante pareça uma tarefa que você precisa superar, só porque não pode se dar ao luxo de perder. No entanto, se envolver com o mesmo trabalho, ou sua essência, através de uma mídia sensorial diferente suprime que o medo de sobrecarregar em mais material baseado em texto. Na verdade, ajuda de algumas outras maneiras.

“O envolvimento de vários sentidos fortalece a memória. Quando ouvimos e interagimos – seja através da leitura, da escrita ou do fazer – o cérebro constrói conexões mais fortes, facilitando a lembrança mais tarde”, diz Yasir Naseem, um especialista em lingüística cujo trabalho de pesquisa se concentrou na modernização e gamificação de metodologias de ensino.

Naseem, que atualmente é especialista em currículo de uma empresa líder de ED-Tech, me diz que você não pode confiar apenas em um único meio para aprender. Em vez disso, ele me diz, você precisa combinar diferentes métodos para obter o máximo benefício, variando do efeito sentimental à retenção de memória.

Gêmeos criando uma visão geral de áudio.
Nadeem Sarwar / Trends Digital

Pesquisa publicada em Computadores e educação O Journal também destacou como os alunos encontraram arquivos de áudio como o material de aprendizado e revisão superior. A flexibilidade e a versatilidade sensorial tiveram um papel importante na preferência por podcasts em relação a outras mídias.

“O verdadeiro entendimento e retenção de longo prazo acontecem quando a escuta é combinada com visuais, discussões ou atividades práticas”, acrescenta Naseem. Minhas próprias experiências com a visão geral de áudio de Gêmeos ecoam seu conselho. Tenho uma lembrança mais forte do conhecimento que absorvi através dos podcasts de áudio em comparação com a leitura do mesmo material.

Veja bem, esses podcasts de áudio não são uma conversão simples de texto para áudio. Em vez disso, eles quebram uma parede de texto chata em uma conversa de duas pessoas para a qual você é essencialmente o único público. É um benefício para qualquer material baseado em texto que não desperte instantaneamente sua curiosidade e o impulsiona em uma leitura instantânea.

No meu experimento mais recente, o podcast de áudio de Gemini me ajudou a entender o significado de um artigo discutindo “uma estrutura para o aprendizado neural interpretável com base nas funções de metas teóricas da informação local”. Em termos mais simples, a pesquisa discutiu como as células nervosas se organizam.

Você entende o ponto que estou tentando fazer aqui, certo?

Conveniência, acima de tudo

Gemini AI criando podcast de áudio fora do trabalho de pesquisa.
Nadeem Sarwar / Trends Digital

A conveniência desempenha um papel importante quando se trata de absorver informações. E o mesmo acontece com o entusiasmo e a emoção sobre todo o processo. Conforme um artigo publicado no Computadores em comportamento humano Jornal, podcasts “Aumente a conveniência, flexibilidade e acessibilidade a informações e conhecimentos”. Não demorei muito para perceber isso.

Viver na capital nacional, gastar entre 2 e 3 horas preso em um tráfego ou trajeto público é uma realidade diária para mim. Mas mais do que o desconforto de tudo, é o tempo desperdiçado que mais dói. O material de aprendizado de áudio oferece a maneira mais conveniente de utilizar esse tempo de maneira produtiva.

Com Gêmeos, você tem outro benefício crucial. Você não precisa confiar na disponibilidade de áudio de um determinado livro, artigo de notícias ou material acadêmico. Você pode simplesmente baixar qualquer material à sua disposição, e Gemini o transformará em uma conversa no estilo de podcast.

Há muitas pesquisas multidisciplinares que apóiam os benefícios de uma abordagem baseada em áudio para a aprendizagem. E não se trata apenas de ouvir, mas mais sobre quebrar as coisas e apresentá -las de uma maneira mais acessível.

“Algumas pessoas disseram … elas gostam do fato de que estamos dando a eles algumas coisas que não estão lendo no jornal. Eles gostam do fato … estamos tentando nos apresentar de uma maneira diferente”, diz um artigo de pesquisa que citando um editor de notícias. O artigo, cortesia da Universidade de Syracuse, foi publicado em 2006 durante os primeiros dias da tendência do podcast.

Gerando o podcast de visão geral do áudio em Gemini.
Nadeem Sarwar / Trends Digital

A partir de 2025, os podcasts se tornaram um verdadeiro fenômeno para consumir informações, de material educacional a coisas de entretenimento. De acordo com o Pew Research Center, quase metade dos americanos se envolveu com podcasts. Mais da metade do público pesquisado ouviu podcasts para aprender, entretenimento ou ter algum material de áudio enquanto fazia outra coisa.

Quase um terceiro queria ouvir as opiniões de outras pessoas, e outro segmento igualmente grande foi conectado para que elas pudessem ficar de olho nas notícias e nos eventos atuais. Meu noivado não caiu muito do padrão mencionado acima. Para histórias de jornalismo de forma longa ou trabalho investigativo, muitas vezes achei a versão de podcast mais agradável.

Mais eficaz também

Curiosamente, os podcasts também pareciam impulsionar mudanças práticas. Aproximadamente dois terços dos ouvintes envolvidos com um livro ou filme depois de ouvir um podcast, mais da metade do público começou a seguir uma pessoa nas mídias sociais, e um terço deles fez mudanças no estilo de vida, como fazer exercícios ou mudar sua dieta.

Pesquisa publicada no Jornal de Marketing de Mídia Social Conceitos destacados, como substituição da mídia e similaridade funcional no contexto de ouvir a mídia e a disposição do público. A idéia abrangente é que os usuários avaliem o meio e escolham o que mais lhes convém.

“Para a singularidade do conteúdo do podcast, a influência na disposição da escuta e na substituição da mídia é positiva, sugerindo que conteúdo exclusivo, alta qualidade e ampla diversidade fazem as pessoas quererem ouvir podcasts”, diz o jornal. Pessoalmente, posso atestar essa descoberta também.

pic.twitter.com/mhdugg1zdg

– Nadeemonics (@nsnadeemsarwar) 30 de março de 2025

Nos últimos dias, tenho “vários” inúmeros trabalhos de pesquisa discutindo o impacto da fibra, carne e consumo de alimentos embalados sobre padrões de sono, saúde cognitiva e saúde intestinal. Comparado ao tom abertamente técnico dos artigos científicos, ter dois anfitriões quebrar os achados com um tom “sentimental” e “persuasivo” teve um efeito discernivelmente mais profundo em mim.

Pense nisso como aprender sobre etiquetas sociais ou sensibilidades culturais em um livro. E anos depois, vendo -os em ação com seus próprios olhos. Ou pense em aprender uma língua estrangeira em um livro, tudo por conta própria, e a diferença que faz quando você o aprende com uma pessoa que preenche todo esse conhecimento em seus ouvidos.

A última abordagem colhe melhores resultados. E isso ocorre principalmente porque o efeito composto do engajamento multissensorial acelera o processo de aprendizado ou apenas o torna mais eficaz. A visão geral do áudio de Gemini criaram um efeito semelhante e eles me ajudaram muito.

Alguns obstáculos

Por mais produtivo que tudo pareça, as visões gerais de áudio de Gêmeos não são. Eles podem drenar a verdadeira essência de uma história escrita com bom gosto em seus esforços de “podcasti-Fication”, ou perder alguns pequenos detalhes. Também existem algumas esquisitices funcionais. O comprimento da visão geral do áudio, que corresponde diretamente à profundidade do material de origem, pode ser bastante aleatório.

Resposta fornecida por Gemini Deep Research.
O tipo de trabalho de pesquisa que você pode se transformar em podcasts. Nadeem Sarwar / Trends Digital

Por exemplo, quando alimentei um livro de 260 páginas sobre o tópico de conjugações e morfologia dos verbos no idioma persa, a visão geral do áudio gerada por Gêmeos tinha pouco mais de sete minutos. Qualitativamente, cobriu as peças mais cruciais, mas perdeu os detalhes mais delicados.

Em outro caso, transformei um documento de pesquisa profundo no valor de quatro páginas em um podcast de áudio. A duração para este foi de cerca de 13 minutos. Infelizmente, o chip de tarefa automática de Gêmeos não permite ajustar o comprimento ou a profundidade de conversação da visão geral do áudio.

Se você estiver usando o Google Notebooklm, que é onde o recurso de visão geral do áudio apareceu pela primeira vez, pode escrever um prompt que pode ditar a profundidade da conversa do podcast. Gerei um podcast de áudio com um tempo de execução de 59 no Notebooklm há algumas semanas.

Gêmeos não vão deixar você fazer isso. Ainda não.

Primeira etapa do Processamento de Gemini um PDF em arquivos pelo Google App.
Reconhecimento automático de documentos do aplicativo Gemini in Files. Nadeem Sarwar / Trends Digital

Em seguida, temos a barreira do idioma, pois o Google está atualmente em processo de ajuste fino todo o pipeline além do inglês. Outro problema foi a pronúncia anglicizada. Por exemplo, o apresentador do podcast da IA ​​pronunciou mal o mundo persa “Raf-Thin” como “Raaf-tin”.

Para um ouvido não treinado, não familiarizado com as nuances bilíngues da tradução inglesa-e-persa, ou como os sotaques mudam a percepção auditiva das palavras em um idioma diferente, os hosts do podcast da IA ​​poderiam muito bem estar vomitando total de bobagens.

A soma total das minhas experiências é que a visão geral de Gemini Audio não é uma revolução. Eles apenas oferecem um meio diferente e mais cativante, para se envolver com o conteúdo. Não funciona o tempo todo, mas certamente leva do tédio da leitura de páginas de texto que, de outra forma, o colocariam para dormir.






.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo