Robô tocando violino.

IA para transcrever áudios e gerar melodias chega ao Audacity

O editor de áudio Audacity foi atualizado recentemente com uma série de ferramentas de inteligência artificial desenvolvidas pela Intel, disponíveis através do pacote gratuito de plugins OpenVINO. Essas novas funcionalidades são direcionadas a músicos e editores de podcasts, oferecendo soluções avançadas para transcrição de áudios, isolamento de vocais, geração de músicas a partir de prompts de texto, entre outras possibilidades com o uso da IA.

Como usar IA na edição de áudios no Audacity.
Reprodução: Audacity.

Aplicações em podcasts

Para podcasts, as ferramentas incluem a capacidade de suprimir ruídos externos, priorizando o áudio do locutor, e um plugin que utiliza a tecnologia Whisper da OpenAI para transcrever e traduzir áudios automaticamente. O resultado da transcrição é exibido abaixo da barra de edição, facilitando a localização de frases específicas e a exportação do conteúdo para uso como legenda.

Portanto, você tem estes dois recursos à disposição:

  • Supressão de ruídos externos: é essencial para melhorar a clareza do áudio em gravações feitas em ambientes não ideais. Por exemplo, um podcaster gravando em casa pode utilizar esta funcionalidade para minimizar o som de obras na vizinhança, garantindo que apenas sua voz seja destacada.
  • Transcrição e tradução automática: utilizando a tecnologia Whisper da OpenAI, essa ferramenta permite a transcrição e tradução de áudios diretamente no Audacity. Uma ótima opção para podcasts educacionais ou informativos que desejam disponibilizar transcrições de seus episódios para acessibilidade ou para criar conteúdo escrito complementar. Além disso, facilita a criação de legendas para vídeos de podcasts publicados em plataformas como YouTube.
Transcrição de podcasts e áudios no Audacity.
Reprodução: Audacity.

Ferramentas para músicos

Músicos e produtores encontram no Audacity reforçado com IA uma caixa de ferramentas poderosa para explorar novas possibilidades criativas e técnicas. O novo pacote traz o Music Separation, que permite separar os vocais dos instrumentos em uma faixa, ideal para a criação de covers ou para tocar acompanhamentos

Ah, vale mencionar que os plugins Music Generation e Music Style Remix utilizam a tecnologia de IA generativa Stable Diffusion para criar músicas baseadas em prompts de texto, permitindo aos usuários especificar batidas por minuto, gênero musical, entre outras características.

Resumindo, estes são os novos recursos de IA para músicos:

  • Music separation: ótimo para artistas que desejam criar covers ou praticar com acompanhamentos instrumentais. Por exemplo, um músico pode separar os vocais de uma faixa famosa para adicionar sua própria interpretação vocal ou usar apenas os instrumentais para praticar.
  • Music generation e music style remix: estas ferramentas abrem novos horizontes para a criação musical, permitindo que músicos gerem faixas completas a partir de descrições textuais simples. Um músico pode digitar um prompt como “música calma de piano para estudar” e obter uma composição original que atenda a essa descrição. Da mesma forma, o Music Style Remix pode transformar uma faixa existente em um novo gênero musical, oferecendo uma maneira inovadora de reimaginar obras.
Ferramentas para músicos no Audacity.
Reprodução: Audacity.

Como baixar as ferramentas de IA para o Audacity?

Todas essas ferramentas do pacote OpenVINO já estão disponíveis para download gratuito no Audacity para Windows. Siga os passos abaixo para usar:

  1. Acesse o GitHub: vá até a página oficial do OpenVINO plugins AI para Audacity no GitHub, disponível em: github.com/intel/openvino-plugins-ai-audacity/releases.
  2. Faça o download: escolha a versão mais recente dos plugins e faça o download do arquivo correspondente ao seu sistema operacional Windows.
  3. Instale no Audacity: siga as instruções de instalação fornecidas na página do GitHub para integrar os plugins ao seu Audacity.

Concluindo estas etapas, você terá acesso às ferramentas de IA no Audacity, expandindo suas possibilidades de edição de áudio para podcasts e música.

R2D2 tocando guitarra.

Para explorar ainda mais as fronteiras entre tecnologia, criatividade e inovação, continue acompanhando o blog Positivo Do Seu Jeito.

VOCÊ TAMBÈM PODE GOSTAR
Logo do Google Gemini.

Gemini: o que é e como usar a IA do Google

Teclado de um notebook em 3D com uma tecla com um ponto de interrogação, expressando a dúvida entre instalar Linux ou Windows.

Linux ou Windows: compare os recursos dos sistemas para PC

Crianças em uma sala de aula moderna e usando tecnologia.

Como a tecnologia melhora o processo de aprendizagem escolar?

Satélites em órbita ao redor da Terra.

Primeiros satélites que fornecem rede a celulares são lançados pela Starlink

Homem falando em um celular em uma chamada com tecnologia VoLTE.

Chamada VoLTE: tudo que você precisa saber

Tecla Copilot será inserida nos novos teclados Windows.

Primeiros PCs com tecla especial para inteligência artificial chegam em 2024 no Windows

Inscreva-se na nossa

Newsletter


    Ao clicar em “enviar” a Positivo Tecnologia tratará os seus dados de acordo com a Política de Privacidade e Cookies.