통합 검색 | Korea Science

Generating Radiology Reports via Multi-feature Optimization Transformer

Rui Wang;Rong Hua
- KSII Transactions on Internet and Information Systems (TIIS)
- /
- 제17권10호
- /
- pp.2768-2787
- /
- 2023
As an important research direction of the application of computer science in the medical field, the automatic generation technology of radiology report has attracted wide attention in the academic community. Because the proportion of normal regions in radiology images is much larger than that of abnormal regions, words describing diseases are often masked by other words, resulting in significant feature loss during the calculation process, which affects the quality of generated reports. In addition, the huge difference between visual features and semantic features causes traditional multi-modal fusion method to fail to generate long narrative structures consisting of multiple sentences, which are required for medical reports. To address these challenges, we propose a multi-feature optimization Transformer (MFOT) for generating radiology reports. In detail, a multi-dimensional mapping attention (MDMA) module is designed to encode the visual grid features from different dimensions to reduce the loss of primary features in the encoding process; a feature pre-fusion (FP) module is constructed to enhance the interaction ability between multi-modal features, so as to generate a reasonably structured radiology report; a detail enhanced attention (DEA) module is proposed to enhance the extraction and utilization of key features and reduce the loss of key features. In conclusion, we evaluate the performance of our proposed model against prevailing mainstream models by utilizing widely-recognized radiology report datasets, namely IU X-Ray and MIMIC-CXR. The experimental outcomes demonstrate that our model achieves SOTA performance on both datasets, compared with the base model, the average improvement of six key indicators is 19.9% and 18.0% respectively. These findings substantiate the efficacy of our model in the domain of automated radiology report generation.
https://doi.org/10.3837/tiis.2023.10.010 인용 PDF HTML

고속 집적회로 패키지 인터커넥션을 위한 설계 데이타베이스 (A Design Database for High Speed IC Package Interconnection)

설병수;이창구;박성희;;;유영갑
- 전자공학회논문지A
- /
- 제32A권12호
- /
- pp.184-197
- /
- 1995
In this paper, high speed IC package-to-package interconnections are modeled as lossless multiconductor transmission lines operating in the TEM mode. And, three mathematical algorithms for computing electrical parameters of the lossless multiconductor transmission lines are described. A semi-analytic Green's function method is used in computing per unit length capacitance and inductance matrices, a matrix square root algorithm based on the QR algorithm is used in computing a characteristic impedance matrix, and a matrix algorithm based on the theory of M-matrix is used in computing a diagonally matched load impedance matrix. These algorithms are implemented in a computer program DIME (DIagonally Matched Load Impedance Extractor) which computes electrical parameters of the lossless multiconductor transmission lines. Also, to illustrate the concept of design database for high speed IC package-to-package interconnection, a database for the multi conductor strip transmission lines system is constructed. This database is constructed with a sufficiently small number of nodes using the multi-dimensional cubic spline interpolation algorithm. The maximum interpolation error for diagonally matched load impedance matrix extraction from the database is 1.3 %.
PDF

간소화된 윈도우 푸리에 위상을 이용한 계층적 접근기반의 3차원 객체 추출 기법 (3D Object Extraction Algorithm Based on Hierarchical Approach Using Reduced Windowed Fourier Phase)

민각;한규필;이기수;하영호
- 한국통신학회논문지
- /
- 제27권8A호
- /
- pp.779-785
- /
- 2002
본 논문에서는 두 개의 2차원 영상에서 3차원 객체를 효율적으로 추출하기 위해서 위상 기반의 스테레오 정합 알고리즘을 제시한다. 특히, 윈도우 푸리에 위상을 이용하는 기존의 위상 기반 방법들은 기본적으로 다중-해상도 위상 맵을 사용하기 때문에 계층적인 접근 관점에서 좋은 특성을 가지고 있는 반면 높은 계산량을 요구한다. 그러므로 본 논문에서는 다중-해상도 위상 기반전략과 더불어 위상 계산의 중복성을 제거하는 빠른 계층적 접근기반의 3차원 객체 추출 기법을 제안한다. 또한, 정합 성능을 개선시키기 위해 위상 영역에서 형태학적인 정합 알고리즘을 제시한다. 제안된 알고리즘을 실험한 결과 계산량이 대략 8배 정도로 크게 감소되었으며 안정된 결과 값을 획득할 수 있었다.
KSCI

Improved Light Extraction of Organic Light Emitting Diode With Microcavity structure based on $SiO_2/TiO_2/SIO_2$ Multi 1D Layer

Kang, Nam-Su;Kim, Jai-Kyeong;Yoo, Jai-Woong;Ju, Byeong-Kwon;Chin, Byung-Doo
- 한국정보디스플레이학회:학술대회논문집
- /
- 한국정보디스플레이학회 2007년도 7th International Meeting on Information Display 제7권2호
- /
- pp.1440-1442
- /
- 2007
In this work, we have modeled and fabricated microcavity-enhanced OLED using the 1-dimensional distributed Bragg reflector model (DBR). Results show that simulated spectrum intensity of microcavity OLED increased more than 30% compared to the conventional OLED, by use of DBR with $TiO_2$ and $SiO_2$. Spectral change of green and blue emission was expected to give the deeper color. The experimental design and characterization as well as the matching with simulated properties were performed for microcavity OLED for actual application.
PDF

스켈레톤 벡터 정보와 RNN 학습을 이용한 행동인식 알고리즘 (Using Skeleton Vector Information and RNN Learning Behavior Recognition Algorithm)

김미경;차의영
- 방송공학회논문지
- /
- 제23권5호
- /
- pp.598-605
- /
- 2018
행동 인식은 데이터를 통해 인간의 행동을 인식하는 기술로서 비디오 감시 시스템을 통한 위험 행동과 같은 어플리케이션에 활용되어 질 수 있다. 기존의 행동 인식 알고리즘은 2차원 카메라를 통한 영상이나 다중모드 센서, 멀티 뷰와 같은 장비를 이용한 방법을 사용하거나 3D 장비를 이용하여 이루어져 왔다. 2차원 데이터를 사용한 경우 3차원 공간의 행위 인식에서는 가려짐과 같은 현상으로 낮은 인식율을 보였고 다른 방법은 복잡한 장비의 구성이나 고가의 추가적인 장비로 인한 어려움이 많았다. 본 논문은 RGB와 Depth 정보만을 이용하여 추가적인 장비 없이 CCTV 영상만으로 인간의 행동을 인식하는 방법을 제안한다. 먼저 RGB 영상에서 스켈레톤 추출 알고리즘을 적용하여 관절과 신체부위의 포인트를 추출한다. 이를 식을 적용하여 변위 벡터와 관계 벡터를 포함한 벡터로 변형한 후 RNN 모델을 통하여 연속된 벡터 데이터를 학습한다. 학습된 모델을 다양한 데이터 세트에 적용하여 행동 인식 정확도를 확인한 결과 2차원 정보만으로 3차원 정보를 이용한 기존의 알고리즘과 유사한 성능을 입증할 수 있었다.
https://doi.org/10.5909/JBE.2018.23.5.598 인용 PDF KSCI KPUBS

다층배선 인터커넥트 구조의 기생 캐패시턴스 추출 연구 (A Study on the Extraction of Parasitic Capacitance for Multiple-level Interconnect Structures)

윤석인;원태영
- 전자공학회논문지D
- /
- 제36D권5호
- /
- pp.44-53
- /
- 1999
본 논문에서는 반도체 집적 회로의 다층 배선 인터커넥트 사이의 기생 캐패시턴스를 수치 해석적으로 계산하여 추출하는 새로운 방법과 그 적용 예를 보고한다. 기생 캐패시턴스를 시뮬레이션을 통해 추출하기 위하여, 복잡한 형태의 3차원 대층배선 구조물을 유한요소법을 이용하여 해석하였다. 캐패시턴스를 추출하기 위한 3차원 다층배선 구조물은 3차원 변환 정보를 가진 2차원 평면 마스크 레이아웃 데이터로부터 생성하였다. 시뮬레이션 결과의 정확도를 검증을 위하여 8.0×8.0×5.0㎛\sup 3\ 크기의 영역에 평행한 두 도전층이 상하로 교차한 구조에 대하여 실험치와 비교하였다. 3차원 다층배선 구조물의 기생 캐패시턴스 추출을 위해서, 유한 요소법 적용을 위한 1,960개의 노드와 8,892개의 사면체 메쉬를 생성하였으며, ULTRA SPARC 1 워크스테이션에 대해서 소요된 CPU 시간은 28초이었으며, 4.4 메가바이트의 메모리를 사용하였다.
PDF

Stereo Vision과 AlphaPose를 이용한 다중 객체 거리 추정 방법에 관한 연구 (A Study on the Estimation of Multi-Object Social Distancing Using Stereo Vision and AlphaPose)

이주민;배현재;장규진;김진평
- 정보처리학회논문지:소프트웨어 및 데이터공학
- /
- 제10권7호
- /
- pp.279-286
- /
- 2021
최근 COVID-19 확산 방지를 위한 공공장소에서는 최소 1m 이상을 유지하는 물리적 거리두기 정책을 실행하고 있다. 본 논문에서는 드론과 CCTV가 취득한 스테레오 영상에서 실시간으로 사람들 간의 거리를 추정하는 방법과 추정된 거리에서 1m 이내의 객체를 인식하는 자동화 시스템을 제안한다. 기존의 CCTV를 이용하여 다중 객체 간의 거리 추정에 사용되었던 방법의 문제점으로는 한 대의 CCTV만을 이용하여 객체의 3차원 정보를 얻지 못한다는 것이다. 선, 후행하거나 겹쳐진 사람 간의 거리를 구하기 위해서는 3차원 정보가 필요하기 때문이다. 또한, 일반적인 Detected Bounding Box를 사용하여 영역 안에서 사람이 존재하는 정확한 좌표를 얻지 못한다. 따라서 사람이 존재하는 정확한 위치 정보를 얻기 위해 스켈레톤 추출하여 관절 키포인트의 2차원 좌표를 획득한 후, Stereo Vision을 이용한 카메라 캘리브레이션을 적용하여 3차원 좌표로 변환한다. 3차원으로 변환된 관절 키포인트의 중심좌표를 계산하고 객체 간 사이의 거리를 추정한다. 3차원 좌표의 정확성과 객체(사람) 간의 거리 추정 실험을 수행한 결과, 1m 이내에 존재하는 다수의 사람 간의 거리 추정에서 0.098m 이내 평균오차를 보였다.
https://doi.org/10.3745/KTSDE.2021.10.7.279 인용 PDF KSCI

비제약적 환경에서 얼굴 주요위치 특징 서술자 기반의 얼굴인식 (Face Recognition Based on Facial Landmark Feature Descriptor in Unconstrained Environments)

김대옥;홍종광;변혜란
- 정보과학회 논문지
- /
- 제41권9호
- /
- pp.666-673
- /
- 2014
본 논문에서는 비제약적 얼굴 데이터 베이스를 위한 확장성 있는 얼굴 인식 방법을 연구하고, 간단한 실험 결과를 소개한다. 기존의 얼굴 인식 연구들은 주로 조명, 얼굴 각도, 표정, 배경 등 제약이 있는 환경에서의 정확도 향상에 초점을 맞추고 있어서 비제약적 얼굴 데이터 베이스에 사용하기에 적합하지 않다. 제안하는 얼굴인식 방법은 비제약적 얼굴 인식을 위한 특징 추출 알고리즘으로, 먼저 지역적 특징이 존재하는 눈, 코, 입과 같이 얼굴의 중요한 특징을 나타내는 영역을 분리한다. 각 얼굴 주요 위치는 고차원의 다중 스케일 국부 이진패턴 히스토그램(Multi-scale LBP histogram) 특징 벡터로 기술된다. 단일 얼굴 주요 위치에 해당하는 다중 스케일 국부 이진패턴 히스토그램 특징 벡터는 주성분 분석법(PCA: Principal Component Analysis)과 선형 판별 분석법(LDA: Linear Discriminant Analysis)의 차원 축소 과정을 통해 저차원 얼굴 특징 벡터를 생성한다. 저차원 얼굴 특징 벡터는 랭크 획득과 Precision at k(p@k) 성능 평가 방법을 이용하여 제안한 알고리즘의 얼굴 인식 성능을 검증한다. 본 연구는 FERET, LFW 및 PubFig83 데이터 베이스를 이용하여 얼굴 인식 실험을 수행하였으며, 제안한 알고리즘을 이용한 얼굴 인식 방법이 기존의 방법보다 향상된 인식성능을 보였다.
https://doi.org/10.5626/JOK.2014.41.9.666 인용

다해상도 웨이블릿 변환과 써포트 벡터 머신을 이용한 자연영상에서의 문자 영역 검증 (Text Region Verification in Natural Scene Images using Multi-resolution Wavelet Transform and Support Vector Machine)

배경숙;최영우
- 정보처리학회논문지B
- /
- 제11B권6호
- /
- pp.667-674
- /
- 2004
이미지에서 문자 추출은 영상을 이해하기 위한 가장 기초적이고 중요한 문제이다. 본 논문에서는 문자의 획 특징을 이용하는 통계적인 방법으로 문자 영역을 검증하는 방법을 제안한다. 제안하는 방법은 $16\times16$ 크기의 텍스트와 비텍스트 이미지를 웨이블릿(wavelet) 변환하여 문자의 획과 방향성을 표현하는 35차원의 특징을 추출한다. 추출된 특징 중 변별력이 높은 특징만을 선택하여 SVM(Support Vector Machine) 분류기를 구성한다. 분류기론 이용하여 $16\times16$크기의 윈도우로 검증 영역을 스캔하면서, 각각의 윈도우를 텍스트와 비텍스트로 분류하고 최종적으로 검증 영역의 텍스트 여부를 결정한다. 제안한 방법을 적용함으로써 텍스트와 유사하여 구별하기 어려운 비텍스트 영역을 검증할 수 있었다.
https://doi.org/10.3745/KIPSTB.2004.11B.6.667 인용 PDF KSCI

다차원 클러스터링 기반의 단백질 2DE 이미지에서의 자동화된 기준점 추출 방법 (Automated Method of Landmark Extraction for Protein 2DE Images based on Multi-dimensional Clustering)

심정은;이원석
- 정보처리학회논문지D
- /
- 제12D권5호
- /
- pp.719-728
- /
- 2005
2DE는 조직 내의 단백질을 규명하는 단백질 분리 기술이다. 그러나 2DE 이미지는 실험 조건, 스캐닝 상태와 같은 환경에 민감하게 영향을 받는다. 이러한 이미지간의 변화를 극복하기 위해서 사용자는 각각의 서로 다른 이미지에 수동으로 기준점을 입력해주어야 한다. 그러나 이 과정은 에러를 발생시키며 긴 시간을 요구하는 작업으로, 빠른 분석에 장애 요인이 된다. 따라서 본 논문에서는 기준점 프로파일에 기반 하여 기준점을 자동으로 추출하는 방법을 개발하였다. 기준점 프로파일은 이미 확인된 이미지들의 기준점들에 대한 클러스터링 방법을 통하여 생성하며, 각 클러스터의 다양한 속성을 정의한다. 새로운 이미지가 입력되면 기준점의 후보 스팟들을 대상으로 프로파일과 비교하석 기준점을 추출한다. 그리고 $A^*$알고리즘을 이용하여 기준점 선정 과정을 최적화한다. 본 논문에서는 실제 사람의 간 조직 이미지를 이용하여 기준점 추출 방법의 성능을 분석하였다
https://doi.org/10.3745/KIPSTD.2005.12D.5.719 인용 PDF KSCI

검색결과 61건 처리시간 0.022초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)