• 제목/요약/키워드: biological information processing

검색결과 275건 처리시간 0.025초

단백질 상호작용 네트워크를 통한 유전체 단위반복변이와 트랜스유전자 발현과의 연관성 분석 (Genome-Wide Association Study between Copy Number Variation and Trans-Gene Expression by Protein-Protein Interaction-Network)

  • 박치현;안재균;윤영미;박상현
    • 정보처리학회논문지D
    • /
    • 제18D권2호
    • /
    • pp.89-100
    • /
    • 2011
  • 인간 유전체에 존재하는 유전적 구조 변이(genetic structural variation) 중 하나인 유전체 단위반복변이(Copy Number Variation, CNV)은 유전자의 기능 발현과 밀접한 관련이 있다. 특히 특정 유전 질병이 있는 사람들을 대상으로 CNV와 유전자발현의 관계를 밝히는 연구가 계속 진행되고 있지만, 정상인 유전체에 대한 CNV의 기능적 분석은 아직 활발히 이루어지고 있지 않다. 본 논문에서는 다수의 정상인 샘플에서 찾아낸 공통된 CNV에 대하여 유전자들과의 기능적 관계를 유전자의 분자적 위치와 상관없이 밝힐 수 있는 분석 방법을 제시한다. 이를 위해 서로 다른 이질적인 생물학데이터를 통합하는 방법을 제시하고 공통된 CNV와 유전자와의 연관성을 분자적 위치와 상관없이 계산할 수 있는 새로운 방법을 제시한다. 제안된 방법의 유의성을 보이기 위해서 유전자 온톨로지 (Gene Ontology) 데이터베이스를 이용한 다양한 검증 실험들을 수행하였다. 실험결과 새롭게 제안된 연관성 측정방법은 유의성이 있으며 공통된 CNV와 강한 연관성을 갖는 유전적 기능의 후보들을 시스템적으로 제시할 수 있는 것으로 나타났다.

서열 데이타마이닝을 통한 단백질 서열 예측기법 (A Protein Sequence Prediction Method by Mining Sequence Data)

  • 조순이;이도헌;조광휘;원용관;김병기
    • 정보처리학회논문지D
    • /
    • 제10D권2호
    • /
    • pp.261-266
    • /
    • 2003
  • 단백질은 아미노산의 선형 중합체(linear polymer)로서 생체의 조직을 구성하고 각종 생화학 반응을 조절하는 역할을 하는 가장 중요한 생체 분자에 속한다. 이러한 단백질의 특성과 기능은 해당 단백질을 구성하는 아미노산의 서열에 의해 결정되기 때문에, 주어진 단백질의 서열을 알아내는 것은 단백질 기능 연구의 출발점이다. 본 논문은 기존의 생화학적 단백질 서열 결정 방법의 단점을 극복할 수 있는 데이터 마이닝 기반 단백질 서열 예측 기법을 제안한다. 복수개의 단백질 절단효소(protease)를 적용함으로써, 서로 중첩된 단백질 조각을 얻어내고, 각 조각의 질량 정보와 단백질 데이타베이스를 이용하여 후보 서열을 식별한다. 얻어진 후보 서열의 조립을 통해 전체 서열을 결정하기 위한, 다중 분할 그래프(multi-partite graph) 구축 및 경로 탐색 기법을 제안한다. 아울러, 대표적인 단백질 서열 데이타베이스인 SWISS-PROT을 이용한 실험을 통해 제안한 방법의 성능을 평가한다.

한국산 놀래기과 어류의 분류학적 검토 (Taxonomical Review of the Korean Labroidei (Teleostei: Perciformes))

  • 김병직
    • 한국어류학회지
    • /
    • 제21권sup1호
    • /
    • pp.74-74
    • /
    • 2009
  • The perciform suborder Labroidei comprising six families (Cichlidae, Embiotocidae, Pomacentridae, Labridae, Odacidae, and Scaridae) are characterized by having the specialized pharyngeal jaws for food processing, i.e., united fifth ceratobranchials and upper pharyngeal jaw articulating with the basicranium via diarthroses (Stiassny and Jensen, 1987). They usually inhabit in the most tropical and subtropical seas and comprise about 235 genera and roughly 2,274 species worldwide (Nelson, 2006). Concerning the Korean labroid fishes, Mori (1952) had listed 18 genera and 26 species belong to four families in his check list of Korean fishes since Jordan and Metz (1913) firstly reported six genera and seven species in only two families (Embiotocidae and Labridae). Chyung (1977) added two species, Tilapia mossambica and Cirrhilabrus temmincki, to Mori’s list and also classified them into three suborders, i.e., Embiotocina (containing only Embiotocidae), Pomacentrina (Cichlidae and Pomacentridae), and Labrina (Labridae and Scaridae). Subsequently, Lee and Kim (1996) reviewed the Korean labroidfishes taxonomically resulting in 22 genera and 32 species in five families with some taxonomical modifications including a new Korean record. It is remarkable to be added many new Korean recordsto the pomacentrids or the labrids for recent 10 years (Koh et al., 1995; Yoo et al., 1995; Koh et al., 1997; Myoung, 1997; Choi and Kim, 2000; Choi et al., 2002; Kim and Go, 2003). Recently, Kim et al. (2005) briefly described all members of the Korean Labroidei with a color photograph or a figure, recognizing 27 genera and 42 species in five families. In the present study, the current taxonomical status of the Korean labroid fishes including distributional features is summarized based both on specimens collected from the Korean waters and on literature survey to provide bio-information of the Korean native fish species. As a result, the Korean labroid fishes totally consist of 27 genera and 44 species in five families, that is, Cichlidae (1 species), Embiotocidae (3), Pomacentridae (15), Labridae (22), and Scaridae (2). They distributed mainly in the coastal waters of the South Sea, Korea, however, most pomacentrids or labrids occur in the coastal waters of Jeju Island only, although some species were observed in their larval or juvenile stages only from coastal waters of the island. Interestingly, several species are expanding their distribution north to Ulreung and Dok islands in the East Sea, Korea lately.

블록순환 행렬에 의한 이중나선 DNA 구조 (I) (A Double Helix DNA Structure Based on the Block Circulant Matrix (I))

  • 이성국;박주용;이문호
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.203-211
    • /
    • 2016
  • 유전자 코드는 바이오 정보 처리에 키 포인트로 인체의 유기적인 조직체이다. 현대 과학에서는 유전자 코드 분자구조의 신비스러운 특성을 체계적으로 설명하고 이해하는데 연구가 집중되고 있다. 본 논문에서는 유전자 시스템을 대칭적으로 해석하는데 중점을 두었고, Jacket 행렬로 무잡음 RNA 유전자 코드를 가장 단순하게 해석했다. 이유는 Jacket 행렬과 RNA는 그 역행렬이 Element (Block)-wise Inverse로 그 역(Inverse)도 자신이란 점과 대칭적 성질, 그리고 Kronecker곱을 갖기 때문이다. 제안된 방법이 유전자 RNA 코돈(Codon : 괘(卦))의 견지에서 Jacket 행렬의 분해를 통해 간단하고 명료함을 보인다.

Gabor 특징과 FSVM 기반의 연령별 얼굴 분류 (Age of Face Classification based on Gabor Feature and Fuzzy Support Vector Machines)

  • 이현직;김윤호;이주신
    • 한국항행학회논문지
    • /
    • 제16권1호
    • /
    • pp.151-157
    • /
    • 2012
  • 최근 영상처리기술과 컴퓨터과학의 발달로 연령변화에 따른 얼굴형상 분류 방법은 일반적인 주제가 되었다. 사람의 연령별 얼굴분류는 생물학적 유전자와 오랜 생활의 식습관으로 인하여 얼굴 형상이 변하기 때문에 통계적 형상만으로 예측하기란 쉽지 않다. 본 논문에서는 Gobor 특징과 fuzzy SVM 기법을 이용하여 연령대별 얼굴분류 기법을 제안하였다. Gabor 웨이블릿 함수는 얼굴의 특징벡터를 구하기 위하여 사용되고 연령대별 얼굴형상 구분이 애매모호한 문제를 해결하기 위해 fuzzy SVM 기법을 이용하여 연령별 소속 함수를 정의하였다. 제안한 방법으로 연령별 소속함수에 따른 얼굴 분류 실험을 수행하였고 제안한 방법의 타당성을 확인하였다.

차세대 유전체 기술과 환경생물학 - 환경유전체학 시대를 맞이하여 (Next-generation Sequencing for Environmental Biology - Full-fledged Environmental Genomics around the Corner)

  • 송주연;김병권;권순경;곽민정;김지현
    • 환경생물
    • /
    • 제30권2호
    • /
    • pp.77-89
    • /
    • 2012
  • With the advent of the genomics era powered by DNA sequencing technologies, life science is being transformed significantly and biological research and development have been accelerated. Environmental biology concerns the relationships among living organisms and their natural environment, which constitute the global biogeochemical cycle. As sustainability of the ecosystems depends on biodiversity, examining the structure and dynamics of the biotic constituents and fully grasping their genetic and metabolic capabilities are pivotal. The high-speed high-throughput next-generation sequencing can be applied to barcoding organisms either thriving or endangered and to decoding the whole genome information. Furthermore, diversity and the full gene complement of a microbial community can be elucidated and monitored through metagenomic approaches. With regard to human welfare, microbiomes of various human habitats such as gut, skin, mouth, stomach, and vagina, have been and are being scrutinized. To keep pace with the rapid increase of the sequencing capacity, various bioinformatic algorithms and software tools that even utilize supercomputers and cloud computing are being developed for processing and storage of massive data sets. Environmental genomics will be the major force in understanding the structure and function of ecosystems in nature as well as preserving, remediating, and bioprospecting them.

More about Taxonomic Sufficiency: A Case Study using Polychaete Communities in a Subtropical Bay Moderately Affected by Urban Sewage

  • Muniz Pablo;Pires-Vanin Ana M. S.
    • Ocean Science Journal
    • /
    • 제40권3호
    • /
    • pp.127-143
    • /
    • 2005
  • The taxonomic sufficiency approach has been proposed as a surrogate for the typical analysis of species-abundance data, especially in conditions involving prominent pollution gradients. Here, we evaluate the use of taxonomic sufficiency with infralittoral macrobenthic data derived from samples taken in a moderate polluted subtropical environment in southeastern Brazil, analysing five taxonomic levels and including two functional levels throughout polychaete feeding guilds and trophic groups. The data were collected seasonally at nine stations and studied for two abundance data series (0.5 and 1.0 mm sieve mesh-size). The results showed a similar ordination pattern between the two sieve mesh-size, but with the 0.5 mm sieve data a different pattern was observed during austral summer. A slight loss of information was detected using genus, family, polychaete species and their feeding guilds as taxonomic/functional units. These results together with those of the cost! benefit ratio, suggested that the family level seemed to be sufficient to detect the impact caused by moderate pollution in this shallow-water, subtropical environment. In additional, through the use of feeding guilds, similar patterns are obtained. Correlation analysis showed that chlorophyll a, total organic matter, zinc, and chromium sediment content were the variables that best explained the biological pattern observed and not always the best correlation coefficient occurring at the species level. The feeding guild approach seems to be useful and generates interpretable results similar to those obtained with the species level of the whole macroinfauna. The results showed an important cost reduction in the sample processing, suggesting that it is possible to adopt a coarser taxonomic level monitoring program even in species-rich communities.

대규모 가스 센서 어레이에서 중복도의 제거와 확률신경회로망을 이용한 분류 (The Classification Using Probabilistic Neural Network and Redundancy Reduction on Very Large Scaled Chemical Gas Sensor Array)

  • 김정도;임승주;박성대;변형기;;김정주
    • 센서학회지
    • /
    • 제22권2호
    • /
    • pp.162-173
    • /
    • 2013
  • The purpose of this paper is to classify VOC gases by emulating the characteristics found in biological olfaction. For this purpose, we propose new signal processing method based a polymeric chemical sensor array consisting of 4096 sensors which is created by NEUROCHEM project. To remove unstable sensors generated in the manufacturing process of very large scaled chemical sensor array, we used discrete wavelet transformation and cosine similarity. And, to remove the supernumerary redundancy, we proposed the method of selecting candidates of representative sensor representing sensors with similar features by Fuzzy c-means algorithm. In addition, we proposed an improved algorithm for selecting representative sensors among candidates of representative sensors to better enhance classification ability. However, Classification for very large scaled sensor array has a great deal of time in process of learning because many sensors are used for learning though a redundancy is removed. Throughout experimental trials for classification, we confirmed the proposed method have an outstanding classification ability, at transient state as well as steady state.

비지도 학습을 이용한 생체 모방 동작 인지 기반의 동작 순서 인식 (Bio-mimetic Recognition of Action Sequence using Unsupervised Learning)

  • 김진옥
    • 인터넷정보학회논문지
    • /
    • 제15권4호
    • /
    • pp.9-20
    • /
    • 2014
  • 대상의 동작을 잘 예측하는 것은 사회적 상호작용과 의사결정 컨텍스트 이해의 핵심이다. 본 연구는 동작 인식 과정에서 인간 뇌 시각인지 과정을 모방한 방법으로 관절 동작의 동작 순서 패턴을 학습하는 컴퓨팅 모델을 제안하였다. 제안 방법의 핵심은 뇌에서 동작 인지 자극을 처리하는 신경생리학적 IT, MT, STS의 피질 기능과 특정 시각 신경 회로 네트워크 기능을 모방하여 비지도 방법으로 동작 순서를 학습한 후 동작을 예측, 인식하는 것이다. 실험을 통해 제안 모델이 어떻게 연속적으로 입력되는 비디오에서 의미있는 동작 스냅샷 뿐 아니라 중요한 동작 패턴을 자동으로 선택하는 지를 제시하였다. 이 핵심 움직임은 학습 네트워크가 정적 시점에서 정지 영상에 함축된 동작을 인식하는지를 증명하는데 이용하는 관절 자세이다. 또한 STS 피질 영역에서 어떻게 정지와 움직임 입력을 통합하는지를 모방하여 학습하고, 학습한 피드백 연결이 차후 동작의 입력 순서를 어떻게 예측하는지를 제시하였다. 네트워크 시뮬레이션을 통해 동작 인식에 대한 제안 모델의 우수성을 입증하였다.

트레이닝 데이터 생성과 의사 결정 트리를 이용한 계통수 생성 방법 (The Training Data Generation and a Technique of Phylogenetic Tree Generation using Decision Tree)

  • 채덕진;신예호;천태영;고흥선;류근호;황부현
    • 정보처리학회논문지D
    • /
    • 제10D권6호
    • /
    • pp.897-906
    • /
    • 2003
  • 전통적인 동물 계통수(系統樹)는 초기발생 혈질에 기초하여 몸 구조가 단순한 것에서 복잡한 것으로 동물문(animal phylum)들을 배열하는 것이다. 현재 활발하게 연구 진행되는 분자수준에서의 분자계통 분류학(Molecular Systematics) 연구들이 이런 경향을 재평가하고 새로운 계통과 진화의 의미를 제시하고 있다. 본 논문에서는 한 염기서열로부터 획득할 수 있는 특성 값들을 추출하여 트레이닝 데이터를 생성하고, 생성된 데이터를 기반으로 데이터마이닝 기법중의 하나인 분류기법(classification) 을 사용하여 계통수를 생성하였다. 실험용 데이터는 미토콘드리아 염기서열을 사용하였으며 생물학분야에서 사용하는 분석 프로그램인 MEGA 프로그램을 사용하여 이를 증명하였다. 비록 마이닝을 수행한 결과는 생물학적 실험을 거쳐 정확성을 검증 받아야 하지만 인터넷상에 떠다니는 무수한 유전체들에 대한 유효한 분류기준을 제시할 수 있고 계통수 제작을 위한 실험에 소요되는 많은 시간과 노력들을 줄일 수 있다.