SMALL 분류 전체보기527 Web) Web Audio API 사용 시 다른 크롬 탭에서 재생하는 소리가 녹음이 안되는 현상 안녕하세요, 코린이의 코딩 학습기 채니 입니다.개인 포스팅용으로 내용에 오류 및 잘못된 정보가 있을 수 있습니다.Web Audio API 사용 시 다른 크롬 탭에서 재생하는 소리가 녹음이 안되는 현상Web Audio API를 이용하여 마이크 음성을 텍스트로 실시간으로 변환하는 작업을 하던 중,크롬의 다른 탭에서 재생하는 소리를 녹음하지 못하는 현상을 발견하였다. 보안 및 개인 정보 보호의 이유로 크롬에서 막아두었다고 한다. 그래서 어디까지 녹음이 가능한지 테스트를 해보았다.다른 크롬 탭에서 나오는 소리를 인식하는가?불가 🙅🏻♀️크롬 시크릿 모드에서 재생되는 소리를 일반 크롬 창의 마이크에서 인식 가능한가?불가 🙅🏻♀️Safari에서 재생되는 소리를 일반 크롬 창의 마이크에서 인식 가능한가?가.. 2024. 12. 12. STT) Azure STT 기술 검토 안녕하세요, 코린이의 코딩 학습기 채니 입니다.개인 포스팅용으로 내용에 오류 및 잘못된 정보가 있을 수 있습니다. STT (Speech-To-Text) 기술을 사용해야하는 프로젝트가 생겨서 Google, Naver, Azure가 제공하는 STT 서비스를 기술 검토해보았다.검토사항은 아래와 같다.스트리밍 처리가 가능한가한국어를 가장 잘 인식할 수 있는가가격은 저렴한가Azure지원언어: 100개 이상 (언어지원)Azure 공식 홈페이지가격Standard를 기준으로 실시간 대화 내용 기록만 사용한다고 가정했을 때 가격은 아래와 같다.1분: $0.0167 (약 23원)1시간: $1.00 (약 1,384원)리소스 한도서비스 이용해보기Anaconda 설치 및 설정 (이미 설치되어 있는 경우 생략 가능)$ brew.. 2024. 12. 10. STT) Naver Cloud(Clova) STT 기술 검토 안녕하세요, 코린이의 코딩 학습기 채니 입니다.개인 포스팅용으로 내용에 오류 및 잘못된 정보가 있을 수 있습니다. STT (Speech-To-Text) 기술을 사용해야하는 프로젝트가 생겨서 Google, Naver, Azure가 제공하는 STT 서비스를 기술 검토해보았다.검토사항은 아래와 같다.스트리밍 처리가 가능한가한국어를 가장 잘 인식할 수 있는가가격은 저렴한가Naver Cloud (Clova)한국어 / 영어 / 일본어 / 중국어 지원인식 가능 시간장문 인식: 최대 2시간 (sync), 최대 6시간 (Batch, async)단문 인식: 최대 60초인식 파일 크기장문인식 : 최대 2GB (빌더), 최대 20GB (API)단문인식 : 최대 10MB (빌더, API)Clova 공식 홈페이지가격 서비스 중.. 2024. 12. 10. Python) ERROR: Failed to build installable wheels for some pyproject.toml based projects (pyaudio) 오류 안녕하세요, 코린이의 코딩 학습기 채니 입니다.개인 포스팅용으로 내용에 오류 및 잘못된 정보가 있을 수 있습니다.실행 환경MacOSpython 3.11pyaudio 설치 시 ERROR: Failed to build installable wheels for some pyproject.toml based projects (pyaudio) 오류가 발생하였다. MacOS의 경우 portaudio를 먼저 설치한 후 pyaudio를 설치해줘야 한다.$ brew install portaudio$ pip install pyaudio 참고사이트https://github.com/ardha27/AI-Waifu-Vtuber/issues/49 Failed building wheel for PyAudio · Issue #49 .. 2024. 11. 27. STT) Google Cloud STT 기술 검토 안녕하세요, 코린이의 코딩 학습기 채니 입니다.개인 포스팅용으로 내용에 오류 및 잘못된 정보가 있을 수 있습니다. STT (Speech-To-Text) 기술을 사용해야하는 프로젝트가 생겨서 Google, Naver, Azure가 제공하는 STT 서비스를 기술 검토해보았다. 검토사항은 아래와 같다.스트리밍 처리가 가능한가한국어를 가장 잘 인식할 수 있는가가격은 저렴한가Google Cloud125개 언어 지원스트리밍의 경우, 기본적으로 최대 5분까지 스트림을 열어둘 수 있음무한 스트리밍 처리도 가능Google Cloud 공식 홈페이지가격 표준 동적 일괄 인식은 낮은 긴급도로 오디오를 처리하는 기능으로 현재는 굳이 필요 없다고 판단하였다.따라서 표준 인식 모델 & 인식(로깅) 서비스를 이용한다고 가정했을 .. 2024. 11. 27. CS) gRPC란? 안녕하세요, 코린이의 코딩 학습기 채니 입니다.개인 포스팅용으로 내용에 오류 및 잘못된 정보가 있을 수 있습니다.gRPC란?google에서 개발한 어느 환경에서 실행할 수 있는 최신 오픈 소스 고성능 RPC 프레임워크gRPC를 알기 전 RPC가 뭔지 모른다면 아래 아티클을 읽어봅시다!https://chanychu.tistory.com/536 gRPC 특징HTTP/2 기반 전송인증, 추적, 로드 밸런싱 및 상태 확인Protocal buffer 사용 Protocal buffer (proto) 란?구조화된 데이터를 직렬화하는 방식직렬화: 데이터를 파일로 저장하거나 네트워크 통신에 사용하기 위한 형식 (바이트 스트림 형태로 변환)정의 언어(.proto 파일에서 생성), proto 컴파일러가 데이터와 인터페이스하.. 2024. 11. 15. 이전 1 2 3 4 ··· 88 다음 LIST