10. 關系數據庫 (Relational Databases)
關系數據庫因為在大規模 Web 服務上缺乏可擴充性而頗受微詞,然而,關系數據庫仍然是近20年來計算機技術中最偉大的成就。關系數據庫對處理訂單,公司數據方面有著出色的表現。
關系數據庫的核心是以記錄表示數據,記錄存放在數據庫表,數據庫使用查詢語言(SQL)對數據進行搜索與查詢,同時,數據庫對各個數據表進行關聯。
數據庫的標準化技術(normalization)講的是使用正確的方式對數據進行分存以降低冗余,并加快存取速度。
9. 安全 (Security)
隨著黑客的崛起與數據敏感性的上升,安全變得非常重要。安全是個廣義的概念,涉及驗證,授權與信息傳輸。
驗證是對用戶的身份進行檢查,如要求用戶輸入密碼。驗證通常需要結合 SSL (secure socket layer)進行;授權在公司業務系統中非常重要,尤其是一些工作流系統。最近開發的 OAuth 協議可以幫助 Web 服務將相應信息向相應用戶開放。Flickr 便使用這種方式管理私人照片和數據的訪問權限。
另外一個安全領域是網絡設防,這關系到操作系統,配置與監控。不僅網絡危險重重,任何軟件都是。Firefox 被稱為最安全的瀏覽器,仍然需要頻頻發布安全補丁。要為你的系統編寫安全代碼就需要明白各種潛在的問題。
8. 云計算 (Cloud Computing)
RWW 最近的關于云計算的文章 Reaching For The Sky Through Compute Clouds 講到了云計算如何改變大規模 Web 應用的發布。大規模的并行,低成本,與快速投入市場。
并行算法發明以來,首先迎來的是網格計算,網格計算是借助空閑的桌面計算機資源進行并行計算。最著名的例子是 Berkley 大學的 SETI@home 計劃,該計劃使用空閑的 CPU 資源分析太空數據。金融機構也大規模實施網格計算進行風險分析?臻e的資源,加上 J2EE 平臺的崛起,迎來了云計算的概念:應用服務虛擬化。就是應用按需運行,并可以隨著時間和用戶規模而實時改變。
云計算最生動的例子是 Amazon 的 Web 服務,一組可以通過 API 進行調用的應用,如云服務(EC2),一個用來存儲大型媒體文件的數據庫(S3),索引服務(SimpleDB),序列服務(SQS)。
7. 并發 (Concurrency)
并發是軟件工程師最容易犯錯的地方,這可以理解,因為我們一直遵從線形思維,然而并發在現代系統中非常重要。
并發是程序中的并行處理,多數現代編程語言包含內置的并發能力,在 Java,指的是線程。關于并發,最經典的例子是“生產/消費”模式,生產方生產數據和任務,并放入工作線程消費或執行。并發的復雜性在于,線程需要經常訪問共同數據,每個線程都有自己的執行順序,但需要訪問共同數據。Doug Lea 曾寫過一個最復雜的并發類,現在是 core Java 的一部分。
6. 緩存(Caching)
緩存對現代 Web 程序不可或缺,緩存是從數據庫取回,并存放在內存中的數據。因為數據庫直接存取的代價非常高,將數據從數據庫取回并放在緩存中訪問就變得十分必要。比如,你有一個網站,要顯示上周的暢銷書,你可以從數據將暢銷書榜一次性取回放在緩存中,而不必在每次訪問時都去數據庫讀數據。
緩存需要代價,只有最常用的內容才可以放入緩存。很多現代程序,包括 Facebook,依靠一種叫做 Memcached 的分布式緩存系統,該系統是 Brad Firzpatrick 在工作于 LiveJournal 項目時開發的,Memcached 使用網絡中空閑的內存資源建立緩存機制,Memcached 類庫在很多流行編程語言,包括 Java 和 PHP 中都有。
延伸閱讀
文章來源于領測軟件測試網 http://www.kjueaiud.com/