본문 바로가기

전체 글

(193)
Installing HTK on Microsoft Windows(compiling HTK using Microsoft Visual Studio) Prerequisites HTK has been verified to compile using Microsoft Visual Studio. For testing, you will require a Perl interpreter such as ActivePerl. You will need a tool such as 7-zip for unpacking the HTK source code archive. Register on this site by accepting the HTK End User Licence Agreement, then download the latest HTK source code. It is helpful if you have some familiarity with using the DO..
[CMU Sphinx]언어모델(Language Model : LM)파일 생성법 Typical UsageGiven a large corpus of text in a file a.text, but no specified vocabulary Compute the word unigram counts cat a.text | text2wfreq > a.wfreq Convert the word unigram counts into a vocabulary consisting of the 20,000 most common words cat a.wfreq | wfreq2vocab -top 20000 > a.vocab Generate a binary id 3-gram of the training text, based on this vocabulary cat a.text | text2idngram -vo..
CMU SPHINX - JAVA 음성인식 JAVA API 로 예제데모로 제공된 JSGF 파일을 이용하여 음성인식을 작성하였다. 패키지 경로를 재설정해주고 API 와 Sphinx4 발음사전이 들어있는 jar 파일들을 라이브러리 참조를 해준후에 grammar 파일을 새로 작성하여 소스를 수정한 결과 인식률이 그럭저럭 80~90% 정도로 올라갔다. 우리가 인식하여야 하는것은 발음사전에 없는 단어도 있기 때문에 jar 파일의 압축을 풀어 사전파일에 단어들을 추가 및 발음 기호를 참고 하여 발음도 적어준후 이클립스로 다시 컴파일 & 런 결과 인식성공 => 이론적으로 발음을 참조하여 새로운 단어 인식이 가능하다는 것이 증명됨 내가 해야 할것 - JSGF 소스분석 (line by line) - 참조된 class 파일들의 분석 초기버전이 인식이 낮았던이유 -..
DDOS의 원리와 예방방법 2009년 7월 8일 DDOS 공격으로 인하여 청와대 네이버 조선일보뿐 아니라 미국 주요기관 까지 공격을 당해 비상이 걸렸습니다. 우리나라의 경우 인터넷 대란의 기억이 있기 때문에 제 2의 인터넷 대란이 오는 것이 아닌가 하는 우려도 있었는데요 다행이 인터넷 호스팅 업체에 대한 DDOS 공격은 아니므로 직접적인 피해는 없지만 공격목표를 통하는 트래픽 역시 호스팅 업체의 서버를 지나야 하므로 순간 적으로 한곳으로 트래픽이 몰려 서버가 호스팅 업체의 서버가 다운되어 버리면 충분히 가능성이 있는 시나리오 입니다. 많은 분들이 자신들의 PC가 아니라 틍정사이트에 대한 공격을 한다는 기사를 보시고 에이 나는 괜찮겠네 하시는 분들도 있으실 텐데요 DDOS는 한명 또는 그룹을 이룬 블랙해커가 악성코드를 통하여 Bot..
HTK음성인식 초기훈련 - gram 파일생성 $인식어 = word | word..; >> hparse gram wdnet 으로 word network 파일 생성 - 발음사전(dict 작성) - 단어단위 전사파일 작성 =>words.mlf 를 작성함 Master Label File 선언이 필수되어야 함 =>#!MLF!# ~.lab 의 경로를 생성해 준다 mkphones0.led 작성 EX => dict에있는 발음과 일치하는 것을 재배치 IS sil sil => 매 발성의 시작과 끝에 묵음처리 DE sp => 모든 sp(Short Pause)삭제 >> hled -n monophones0 -l * -d dict -i phones0.mlf mkphones.led eords.mlf - 특징추출 => config 파일과 scp 파일 작성..
Running the HTK Demo(htk demo) PATH ADD(In cmd) set path=%path%;"new path way" Among the samples on the HTK website you'll find the HTK-samples package that can be used to test your installation. As an initial test of the installation please run the HTK demonstration using the configuration file HTKDemo\configs\monPlainM1S1.dcf. There is a README file in the HTKDemo directory explaining the operation of the demonstration in ..
[Cmu sphinx]발음 rule light off : no term channel up : speed Tv volume : term channel up : careful pronouncing or announce always keep in mind accent about sentence
[CMU Sphinx]변경사항 여지껏 단어들을 grammar 파일에 한번에 불러오던 방식을 변경 기기별로 구분하여 xml 파일을 받은후 각각의 gram 파일을 생성 JSGF부분에서 최고 기본 gram파일로부터는 기기를 구별하는 단어만 받아와서 기기인식 기기를 인식하면 해당 기기를 작동시키는 gram파일을 재로드해온다. -> jsfg 의 loadAndReconize 와 RecognizeAndReport 함수가 두개씩 존재해야함 작동을 멈추면 다시 기기를 선택하는 초기파일을 재로드하여 초기화. - gram 파일은 socket을 이용하여 전송한다. - 인식된 문구역시 gram파일을 이용하여 전송한다. - 각각의 gram파일은 JSGF의 bestResult 함수에 오는 값에 따라 로드된다. - 전송이 끝나고 파일로 출력및 저장후, Vecto..