Google Cloud có thành phần GC Vision API để nhận dạng chữ trong hình ảnh, văn bản. Nó tự dò tìm từng khối văn bản, nhận ra được chữ thuộc ngôn ngữ gì. Code để nhận dạng chữ trong văn
Speech to text with Google Cloud
Code speech to text with Google cloud: Convert WAV to FLAC, by running sox in terminal: sox ZOOM0005_Tr1.wav ZOOM0005_Tr1.flac or use FFMPEG to convert MP3 to FLAC in terminal: ffmpeg -i input.mp3 output.flac Upload file to Google Cloud Storage folder