- 論壇徽章:
- 0
|
數(shù)據(jù)文件加載進(jìn)數(shù)據(jù)倉(cāng)庫(kù),最麻煩的地方就是數(shù)據(jù)文件中數(shù)據(jù)發(fā)生錯(cuò)位。
例如,字段錯(cuò)位,記錄錯(cuò)位。
為解決這個(gè)問題,有必要對(duì)數(shù)據(jù)文件的字段分隔符,記錄分隔符進(jìn)行合理的設(shè)置。
根據(jù)經(jīng)驗(yàn),選擇特殊的,而且組合的字符集作為分隔符,會(huì)比較理想。
經(jīng)過調(diào)研,sybase,informix,sql server均可以采用組合字符的方式提取數(shù)據(jù)。
其中sybase,sql server采用bcp方式下載文本,通過在format文件中規(guī)定好字符,即可
informix采用hpl方式下載文本,通過在format文件中規(guī)定好字符組合,即可。
oracle的數(shù)據(jù)采集,需要另外測(cè)試一下。
本文來自ChinaUnix博客,如果查看原文請(qǐng)點(diǎn):http://blog.chinaunix.net/u/4353/showart_1922297.html |
|