Mengapa "Voice x AI" Menarik Perhatian Saat Ini?
Kemunculan Generative AI menandai gelombang keempat dari perkembangan AI yang disebut sebagai revolusi baru. Bukan hanya tren sementara, revolusi ini diperkirakan akan bertahan lama, layaknya internet atau smartphone.
Dibandingkan dengan data teks atau gambar, penggunaan dan manfaat suara dalam AI belum begitu dikenal. Namun, ada berbagai teknologi canggih seperti pengubahan voice-to-text otomatis, peringkasan percakapan, dan analisis emosi dari isi percakapan. Dengan memanfaatkan teknologi ini, kita bisa meningkatkan produktivitas dan mengubah percakapan menjadi aset big data untuk analisis AI.
Ketika teknologi pengenalan suara semakin meluas, perubahan pun dirasakan dalam kehidupan sehari-hari. Misalnya, saat ini kita umumnya mengoperasikan komputer dengan keyboard dan mouse atau menggunakan ponsel dengan layar sentuh. Namun, dengan semakin tingginya akurasi pengenalan suara, kebutuhan akan antarmuka berbasis suara (Voice User Interface atau VUI) seperti smart speaker juga meningkat. VUI memungkinkan input suara yang lebih cepat dan efisien, serta waktu operasional yang lebih singkat.
Selain itu, diperkirakan penggunaan suara dalam menyampaikan informasi akan semakin meningkat. Saat ini, informasi yang dihasilkan oleh AI biasanya disajikan dalam bentuk teks atau grafik, yang mudah dipahami namun memerlukan fokus visual. Sebaliknya, dengan menggunakan suara, kita dapat mendengarkan informasi secara multitasking atau sambil melakukan aktivitas lain. Meski otak harus tetap memproses isi informasi tersebut, indra penglihatan, tangan, dan kaki tetap bebas, sehingga meningkatkan efisiensi waktu dan diharapkan dapat secara signifikan meningkatkan produktivitas.
Potensi Data Suara di Era AI
Selama ini, data bisnis lebih sering berbentuk teks atau gambar, misalnya dalam bentuk email atau dokumen. Namun, penelitian menunjukkan bahwa setiap harinya, orang menghabiskan sekitar 6 jam untuk berbicara, termasuk dalam pertemuan bisnis.
Percakapan antara pelanggan dan tim terkait sering kali mengandung informasi penting yang mendukung proses negosiasi atau keputusan bisnis. Namun, mencatat percakapan ini dengan lengkap dapat memakan waktu dan sulit dilakukan tanpa adanya bias.
Dengan merekam percakapan dan menganalisisnya menggunakan AI, kita dapat mengubah percakapan tersebut menjadi catatan yang otomatis terstruktur. AI mampu memisahkan percakapan berdasarkan topik dan menunjukkan perubahan emosi, sehingga informasi dapat disampaikan secara akurat dan efisien.
Selain itu, teknologi ini bisa menganalisis dan memvisualisasikan cara bicara seseorang. Misalnya, kita bisa melihat bagaimana reaksi orang lain terhadap topik yang dibicarakan tanpa harus repot merangkum atau menganalisis sendiri. Dengan bantuan data suara dan AI, komunikasi bisa menjadi lebih baik.
Dengan menggunakan AI untuk menganalisis percakapan, kita bisa mengatasi masalah di mana tidak jelas apa yang dibicarakan antara pelanggan dan agent. Dalam jangka panjang, data suara yang terkumpul juga bisa diolah menjadi big data.
Namun, penting untuk diingat bahwa hanya merekam suara saja tidak cukup untuk menggunakan AI. Di call center, meskipun merekam percakapan pelanggan sudah menjadi hal biasa, data rekaman itu harus diubah menjadi bentuk yang bisa dipahami oleh AI.
Dengan menggunakan mesin pengenalan suara, kita bisa mengubah percakapan menjadi teks. Kemudian, informasi ini bisa dihubungkan dengan analisis gaya bicara dan emosi serta data dari sistem lain.
Dengan cara ini, kita bisa memecahkan masalah “black box” di mana informasi lengkap seperti “siapa yang berbicara, kapan, dalam konteks industri apa, dengan siapa, tentang apa, cara bicaranya seperti apa, dan hasilnya,” yang semuanya bisa diubah menjadi data terstruktur yang siap digunakan oleh AI.
Contoh Penggunaan Voice x AI dalam Dunia Bisnis
Suara dan AI memiliki potensi yang besar untuk memperkuat penjualan, pemasaran, serta pelatihan karyawan.