Sunday September 04, 2005 筆者認為,Regular Expression是非常值得學習的東西,
從簡單的UNIX指令,程式語言,到XML Schema,SQL都有.
如果花點時間研究Regular Expression,會發現這是
投資報酬率很高的一種玩意兒
充斥於計算機領域的Regular Expressions
筆者第一次接觸到Regular Expressions(中文翻譯為『正規表示式』,接下來的內容接採用中文翻譯名稱),是在大學時期選修編譯程式(Compiler)的時候。後來開始學習Unix作業系統管理,常常用到的Unix指令,也都支援正規表示式。因為工作的關係,常常需要處理文字檔,所以開始學習Perl,這時發現正規表示式真是個好東西,當大量機械化的文字處理工作迎面而來,正規表示式大幅減少了工程師的負擔。現在最重要的兩個平台 - .net與Java,也不約而同地提供可以支援正規表示式的API(Java在JDK 1.4之後才開始支援)。對於一個IT從業人員,正規表示式異常地重要,連Oracle 10g資料庫都開始可以在SQL/PLSQL語法中支援正規表示式,可見正規表示式是一個多麼有趣,具有多用途的工具,堪稱『IT從業人員必備武器』之一。
什麼是正規表示式?
正規表示式並非一個程式語言,而是一種專門用於比對以及置換文字的機制,幾乎各種程式語言,或是涉及文字處理的軟體工具都支援正規表示式。舉例來說, 我們在想要搜尋或取代某個檔案(或字串)當中的滿足某些條件的部分,我們就可以利用正規表示式,指示計算機以較嚴格或較寬鬆的條件去處理。一般Windows使用者所使用的編輯器的『搜尋』、『取代』功能只能單純地找出某個數字文字序列的存在(例如:搜尋”port”,可能找出”important”);或者我們想一次找出Sun、SUN、sun三種大小寫狀態不同的文字,並忽略掉其他大小寫狀態的文字(sUN、suN…等),這些都是傳統的搜尋取代很難做到的,但是只要利用正規表示式的機制,這些複雜的搜尋條件都可以迎刃而解。
學習正規表示式的好書
正規表示式發展了很長的時間,卻由於缺乏一個統一標準,造成各種環境下的正規表示式語法都不盡相同,無法達到『只寫一次,到處通用』的境界。雖然正規表示式的學習曲線不長,但是即使有了正規表示式的基本觀念,卻往往因不同環境之間的語法差異,讓工程師傷透腦筋。要一次學好正規表示式,O’Reilly的出版的Mastering Regular Expressions絕對是上上之選,要應付未來各式各樣不同語法的挑戰,同一個作者所撰寫的Regular Expression Pocket Reference(O’Reilly中文翻譯本 - 正規式速查手冊)更是不可或缺的工具書。
作者在書中第一章,就展示了正規表示式解決『實際問題』的能力,並建議我們把正規表示式當作是一種簡單的語言來學習。所以把正規表示式的結構和語法做了詳細的解釋,讀者可以發現,只要需要對文字做搜尋或取代,正規表示式就可以派上用場,而且幾乎無所不能。從第二章開始,作者讓正規表示式結合Perl,做點實際的應用,像是處理Email的內文(過濾、搜尋)、或是程式設計師常常需要對使用者所輸入的參數做處理,這些過去我們直覺需要寫程式來完成的工作,其實很多都可以用正規表示式漂亮地幫我們解決掉。第三章到第五章,作者帶我們深入正規表示式的運作規則,並介紹許多實用的技巧。第六章之後,開始介紹正規表示式在各種程式語言上的運用,由於可以運用正規表示式的範圍實在太大,作者僅僅挑選了Perl、Java、以及.net進行深度解說,其實已經可以滿足目前大多數工程師的需求。
一輩子都可以受用的東西
Posted by yaya6888421 on November 14, 2006 at 08:38 PM PST #