반응형
파이썬을 사용한 간단한 음성인식 프로그램
pip install SpeechRecognition
pip install pyaudio
import speech_recognition as sr
def recognize_speech_from_mic():
recognizer = sr.Recognizer()
mic = sr.Microphone()
print("마이크에 대고 말씀하세요...")
with mic as source:
recognizer.adjust_for_ambient_noise(source)
audio = recognizer.listen(source)
try:
text = recognizer.recognize_google(audio, language='ko-KR')
print("인식된 내용:", text)
if text == "컴퓨터 켜 줘":
print("컴퓨터를 켭니다.")
else:
print("인식된 내용이 '컴퓨터 켜 줘'가 아닙니다.")
except sr.UnknownValueError:
print("음성을 인식할 수 없습니다.")
except sr.RequestError:
print("음성 인식 서비스에 접근할 수 없습니다.")
if __name__ == "__main__":
recognize_speech_from_mic()
1. 말 할 때 띄어쓰기도 구분한다. 조건문 비교할때 공백 제거하고 비교하는게 좋을듯
2. 단어를 인식했고, 그 후에 공백이 1초이상 지속되면 입력이 끝난것으로 판단한다고 함
pause_threshold <- 디폴트가 1초 인듯
아래는 쓰레시홀드 조정 코드
with mic as source:
recognizer.adjust_for_ambient_noise(source)
recognizer.pause_threshold = 1.2 # 1.2초 이상 침묵하면 발언 종료로 간주
audio = recognizer.listen(source)
반응형
'프로그래밍 관련 > 프로그래밍 관련 잡지식' 카테고리의 다른 글
Tasking compiler 및 makefile (0) | 2025.06.11 |
---|---|
배치 파일에서 외부 프로그램 호출 시, 결과 리턴 받기 (0) | 2025.05.23 |
깃허브 코파일럿 사용하기 (0) | 2025.04.12 |
단축키로 복붙 여러개 하기 (0) | 2023.08.01 |
임베디드 mcu 최적화 코딩 팁 (0) | 2023.07.17 |