본문 바로가기
프로그래밍 관련/프로그래밍 관련 잡지식

파이썬 음성인식 프로그램

by 존버매니아.임베디드 개발자 2025. 5. 29.
반응형

파이썬을 사용한 간단한 음성인식 프로그램

pip install SpeechRecognition
pip install pyaudio

 

import speech_recognition as sr

def recognize_speech_from_mic():
    recognizer = sr.Recognizer()
    mic = sr.Microphone()
    print("마이크에 대고 말씀하세요...")

    with mic as source:
        recognizer.adjust_for_ambient_noise(source)
        audio = recognizer.listen(source)

    try:
        text = recognizer.recognize_google(audio, language='ko-KR')
        print("인식된 내용:", text)
        
        if text == "컴퓨터 켜 줘":
            print("컴퓨터를 켭니다.")
        else:
            print("인식된 내용이 '컴퓨터 켜 줘'가 아닙니다.")
        
        
    except sr.UnknownValueError:
        print("음성을 인식할 수 없습니다.")
    except sr.RequestError:
        print("음성 인식 서비스에 접근할 수 없습니다.")

if __name__ == "__main__":
    recognize_speech_from_mic()

 

1. 말 할 때 띄어쓰기도 구분한다. 조건문 비교할때 공백 제거하고 비교하는게 좋을듯

 

2. 단어를 인식했고, 그 후에 공백이 1초이상 지속되면 입력이 끝난것으로 판단한다고 함

pause_threshold <- 디폴트가 1초 인듯

아래는 쓰레시홀드 조정 코드

with mic as source:
    recognizer.adjust_for_ambient_noise(source)
    recognizer.pause_threshold = 1.2  # 1.2초 이상 침묵하면 발언 종료로 간주
    audio = recognizer.listen(source)

 

 

반응형