Analyzing Architectural History Terminologies by Text Mining and Association Analysis (텍스트 마이닝과 연관 관계 분석을 이용한 건축역사 용어 분석)

  • Kim, Min-Jeong;Kim, Chul-Joo
    • Journal of Digital Convergence
    • v.15 no.1
    • pp.443-452
    • 2017
  • Architectural history traces the changes in architecture through various traditions, regions, overarching stylistic trends, and dates. This study identified terminologies related to the proximity and frequency in the architectural history areas by text mining and association analysis. This study explored terminologies by investigating articles published in the "Journal of Architectural History", a sole journal for the architectural history studies. First, key terminologies that appeared frequently were extracted from paper that had titles, keywords, and abstracts. Then, we analyzed some typical and specific key terminologies that appear frequently and partially depending on the research areas. Finally, association analysis was used to find the frequent patterns in the key terminologies. This research can be used as fundamental data for understanding issues and trends in areas on the architectural history.

A Language Model based Knowledge Network for Analyzing Disaster Safety related Social Interest (재난안전 사회관심 분석을 위한 언어모델 활용 정보 네트워크 구축)

  • Choi, Dong-Jin;Han, So-Hee;Kim, Kyung-Jun;Bae, Eun-Sol
    • Proceedings of the Korean Society of Disaster Information Conference
    • 2022.10a
    • pp.145-147
    • 2022
  • 본 논문은 대규모 텍스트 데이터에서 이슈를 발굴할 때 사용되는 기존의 정보 네트워크 또는 지식 그래프 구축 방법의 한계점을 지적하고, 문장 단위로 정보 네트워크를 구축하는 새로운 방법에 대해서 제안한다. 먼저 문장을 구성하는 단어와 캐릭터수의 분포를 측정하며 의성어와 같은 노이즈를 제거하기 위한 역치값을 설정하였다. 다음으로 BERT 기반 언어모델을 이용하여 모든 문장을 벡터화하고, 코사인 유사도를 이용하여 두 문장벡터에 대한 유사성을 측정하였다. 오분류된 유사도 결과를 최소화하기 위하여 명사형 단어의 의미적 연관성을 비교하는 알고리즘을 개발하였다. 제안된 유사문장 비교 알고리즘의 결과를 검토해 보면, 두 문장은 서술되는 형태가 다르지만 동일한 주제와 내용을 다루고 있는 것을 확인할 수 있었다. 본 논문에서 제안하는 방법은 단어 단위 지식 그래프 해석의 어려움을 극복할 수 있는 새로운 방법이다. 향후 이슈 및 트랜드 분석과 같은 미래연구 분야에 적용하면, 데이터 기반으로 특정 주제에 대한 사회적 관심을 수렴하고, 수요를 반영한 정책적 제언을 도출하는데 기여할 수 있을 것이다

Automatic Preference Rating using User Profile in Content-based Collaborative Filtering System (내용 기반 협력적 여과 시스템에서 사용자 프로파일을 이용한 자동 선호도 평가)

  • 고수정;최성용;임기욱;이정현
    • Journal of KIISE:Software and Applications
    • v.31 no.8
    • pp.1062-1072
    • 2004
  • Collaborative filtering systems based on {user-document} matrix are effective in recommending web documents to user. But they have a shortcoming of decreasing the accuracy of recommendations by the first rater problem and the sparsity. This paper proposes the automatic preference rating method that generates user profile to solve the shortcoming. The profile in this paper is content-based collaborative user profile. The content-based collaborative user profile is generated by combining a content-based user profile with a collaborative user profile by mutual information method. Collaborative user profile is based on {user-document} matrix in collaborative filtering system, thus, content-based user profile is generated by relevance feedback in content-based filtering systems. After normalizing combined content-based collaborative user profiles, it automatically rates user preference by reflecting normalized profile in {user-document}matrix of collaborative filtering systems. We evaluated our method on a large database of user ratings for web document and it was certified that was more efficient than existent methods.

Qualitative and Quantitative Analysis of Paper-Pencil Test Items for Exploring its Appropriateness as a Selection Tool of the Gifted in Science (과학 영재 선발 도구로서 지필 검사의 적합성 탐색을 위한 질적 및 양적 문항 분석)

  • Lee, Ki-Young;Dong, Hyo-Kwan;Hong, Jun-Eui;Kim, Hyun-Kyung;Jo, Bong-Jae
    • Journal of The Korean Association For Science Education
    • v.28 no.1
    • pp.32-46
    • 2008
  • The purpose of this study was to analyse the qualitative and quantitative characteristics of paper-pencil tests for exploring its appropriateness as a selection tool of the gifted in science. For this purpose, we developed two (internal and external) item analysis frameworks, and applied these frameworks to analyse qualitative characteristics. Also, we analysed the relationship between two characteristics. The results of analysing qualitative characteristics revealed that the portion of items with acceleration context exceeding middle school curriculum level was relatively large, which caused low content validity. Furthermore, there was considerable deviation in content and context by subject matter and year, which caused test unstability. Items measuring knowledge domain was the most prevalent, and too much weight on data interpretation & analysis domain in inquiry process skills. In case of creativity test, the portion of items measuring convergent thinking was much larger than that of divergent or associative thinking. Most of these items were represented by using pictures and tables rather than using graphs. Item types of multiple-choice and short answers were superior to essay types. Discrimination index, on the whole, was appropriate (above 0.3), but item difficulty showed a vast deviation ($0.01{\sim}0.90$). Correlation coefficients among subject matters and test tools were very low, and test reliabilities were also low. Low item difficulty & high discrimination index item types were distinguishable. Items with acceleration context were more discriminating than enrichment context. Implications of developing quality paper-pencil test items in the selection of gifted students are discussed.

A Study on Learning Program of Discrete Mathematicsfor Computer Software (컴퓨터 소프트웨어 분야 연구를 위한 이산수학 분야에 대한 연구)

  • Jun, Sang-Pyo
    • Journal of the Korea Society of Computer and Information
    • v.16 no.2
    • pp.235-242
    • 2011
  • The industry of computer has been changed quickly by developing and growing info-communications industry and by supplying new technologies. The importance of software field which is based on this change is gradually emphasized. Nowadays more people tend to have realization of mathematics and statistics that are basic theory of software study, moreover, discrete mathematics is especially getting more important in whole mathematics field. It's essential to understand discrete mathematics in order to understand existing knowledge about software field in computer engineering and develop new technologies in different areas in the future. The way people get education about discrete mathematics, however, is improper as a result of massive materials and uncertain standard. This study subdivides discrete mathematics according to different tracks in the computer software study. In addition, the research which is suitable to individuality in different fields is able to be efficiently carried out by selecting related parts and the method of mathematics education is provided to deal with rapidly changed applications in related fields.

A Policy Framework for the Long-term Preservation of Authentic Digital Records: Based on InterPARES Studies (진본 전자기록의 장기보존을 위한 정책프레임워크: InterPARES 성과물에 기초하여)

  • Lee, Yoon-Ju;Lee, So-Yeon
    • The Korean Journal of Archival Studies
    • /
    • /
    • /
    • 2009
  • The present study aims at developing a policy framework for the long-term preservation of authentic digital records. To accomplish this, the study analyzed the main research outcomes from InterPARES(International Research on Permanent Authentic Records in Electronic System: IP). It has (1) selected major outcomes from IP project, (2) disassemble principles and guidelines suggested by IP into individual concepts and components, (3) rearranged them into a conceptual framework, which has been used as a basis for the policy framework, and finally (4) developed a policy framework for the long-term preservation of authentic digital records. The policy framework suggested here could serve as a basis for either establishing national or institutional policy or developing standards and guidelines for long-term preservation of authentic digital records.

Analysis of the effectiveness of the Recommendation Model for the Customized Learning Course (맞춤형 학습코스 추천 모델의 효과분석 방안)

  • Han, Ji-won;Lim, Heui-seok
    • Proceedings of The KACE
    • 2017.08a
    • pp.221-224
    • 2017
  • 본 논문은 사용자 수준에 적합한 맞춤형 학습코스를 추천하여 학습효과를 향상시킬 수 있는 추천모델을 개발하고, 효과분석을 위한 방안을 제시한다. 학습자 개개인의 학습수준이나 학습내용 등에 따라 적합한 학습주제를 선정하여 제공하는 것은 중요하나, 일반적인 추천은 전문가 그룹을 활용한 사람중심의 추천으로 시간이 오래 걸리는 등 자원의 비효율적 한계점[1]을 가지고 있다. 이를 극복하기 위해, TF-IDF를 이용해 단어별 가중치를 계산하여 고빈도 단어를 추출하여 벡터 공간에 배치시키고, Cosine Similarity 기법을 이용해 벡터간의 유사도를 측정하였다. 학습자 프로파일을 분석하고, 학습스킬간의 연관성을 고려하여 맞춤형 학습코스를 추천하기 위해, 워드 임베딩 기법을 적용하였고, 이를 위해 오픈소스 Gensim[2]을 이용하였다. 맞춤형 학습코스 추천 모델의 효과를 분석하기 위한 실험을 설계하고 평가 문항지를 개발하였다.

상관분석을 응용한 산업재해사례 요인의 고찰

  • 홍광수;정국삼
    • Proceedings of the Korean Institute of Industrial Safety Conference
    • 1997.11a
    • pp.331-336
    • 1997
  • 본 연구에서 산업재해 사례를 연구 대상으로 재해 발생의 여러 가지 요인들의 관련을 검토하고자 통계적 기법을 이용한 재해요인별 상관분석, 또는 영향의 정도 파악, 재해 요인의 통제에 따른 기타 재해요인에 대한 영향 분석을 시도하는 통계학적 분석 방법을 이용한 재해 발생의 중요요인을 분석하고자 첫째, 산업재해 통계 자료의 내용을 분석하여 재해 관련 변수들을 파악하는데 불안전 행동 및 불안전상태에 의한 재해 형태와 기타 변수들 간의 정성적 상관분석을 통한 상관계수를 고찰, 둘째, 명목척도인 범주형 변수 상호 간의 관련 여부를 파악하기 위해 카이제곱(chi-square)검정을 행하여 입원 일수를 종속 변수로 하는 기타 변수들의 독립성 여부와 변수 상호간 연관이 있다고 판단될 때 각 변수의 연관의 정도 비교, 셋째, 어떤 변수 상호간 일정한 관계를 가질 때 변수의 범주별로 반응변수(종속변수)에 미치는 영향을 회귀식 형태로 파악하고 비교하기 위하여 로짓(logit)모형을 적용하였다. (중략)

Improve qualifications of broadcast communications jobs for the NCS utilization (NCS 활용을 위한 "방송통신직종"의 자격 개선)

  • Kim, YoungChul;Song, YoungA
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • /
    • /
  • 최근 이슈화되고 있는 국가직무능력표준(NCS)에서 "방송통신직종"의 직무분석과 "국가기술자격검정"의 자격시험제도에 관한 실행방안을 알아본다. 국가직무능력표준은 학벌 중심의 사회에서 능력 중심의 사회로 전환하기 위한 정부의 정책방향에 따라 표준을 구성하였고, 표준에 기반 하여 학교교육 직업훈련 및 자격제도 개편을 하고자 시행되고 있다. 방송통신직종은 대분류가 정보통신이고, 중분류가 방송기술, 소분류가 방송제작기술, 방송플랫폼기술, 방송서비스로 분류되고 있다. 방송통신 직종의 각 세 분류 내에 능력단위를 보고 "국가기술자격검정"의 연관성을 검토하였다. 결과적으로 국가직무능력표준의 직무 능력단위의 수준을 검토함으로서 국가기술자격검정의 자격등급별로 타당성을 비교하였으나 능력단위 수준 및 능력단위의 내용이 가지고 있는 다양한 직업군을 자격검정으로 맞추지 못 할 것으로 판단이 되고, 자격제도의 올바른 시행을 위해서는 세부 항목을 검토하여 세분화하거나 자격검정을 새롭게 분류하여 제도화를 하거나 정비가 필요할 것으로 판단이 된다.

A Correlation between the Centrality of the Hyperlinks and the Number of Visits in the Homepages of the University (대학 홈페이지 하이퍼링크 중심도와 방문자수 관계 분석)

  • Kwon, Hyejung;Jeon, Mihyun;Bae, Tae-Woong;Kim, Gyu-Tae
    • Annual Conference of KIPS
    • /
    • /
    • /
    • 2017
  • 대학 내 기관별 웹페이지의 방문자 패턴을 분류하고, 하이퍼링크에 따른 네트워크 분석을 통해 방문자수와의 연관성을 연구하였다. 웹페이지 언어에 따라 영문 홈페이지는 공통적으로 낮은 방문 패턴을 보였으며, 단과대학이 개별 학과에 비해 높은 방문자수를 보였다. 웹페이지 하이퍼링크의 중심도(Centrality) 분석에서는 사이중심도(Betweenness centrality)를 정도(degree)로 정규화한 값이 방문자 수의 상한 값에 대응되는 현상이 발견되었다. 홍보효과를 위해 홈페이지 내용, 구조 설계뿐만 아니라 웹 상에 적절한 노출 전략도 도움이 됨을 알 수 있었다.