4. 解決不同問題的 Excel 公式與函數
4.1 將多個文本字符串連接時
這時候你可以使用CONCATENATE函數。CONCATENATE 函數用於將兩個或更多的文字字符串連接為一個文字字符串。例如,=CONCATENATE(A1, " ", B1) 將結合 A1 和 B1 單元格的內容,並在中間插入一個空格。
4.2 查找相關數據時
VLOOKUP 函數將是你的好幫手。例如,=VLOOKUP("John", A1:B10, 2, FALSE) 將在 A1:B10 的範圍中查找 “John”,並返回與 “John” 在同一行的第 2 列的數據。
4.3 計算範圍中滿足特定條件的單元格的數量時
這時,你可以使用 COUNTIF 函數。例如,=COUNTIF(A1:A10, ">20") 將計算 A1:A10 範圍內大於 20 的單元格數量。
4.4 基於一系列條件來進行計算時
這時候你可以使用 SUMIFS 函數。SUMIFS可以基於一個或多個給定條件來對範圍的數據進行求和。例如,=SUMIFS(A1:A10, B1:B10, ">20", C1:C10, "<50") 將會計算在B1:B10範圍內大於20且C1:C10範圍內小於50的對應A1:A10的數據總和。
4.5 在列表或數據集中找到最大值或最小值時
你可以使用 MAX 和 MIN 函數。例如,=MAX(A1:A10) 將返回範圍 A1:A10 中的最大值,而 =MIN(A1:A10) 則會返回這個範圍內的最小值。
4.6 對日期進行操作時
Excel 有許多專門用於處理日期的函數,如 YEAR、MONTH、DAY、TODAY 等。例如,=YEAR(A1) 可以返回 A1 單元格中日期的年份;=TODAY() 函數則返回當前日期。
有 Excel 基礎後怎麼規劃學習?數據分析職涯指引「數據分析職能地圖」
案例實作
假設我們有一個銷售數據的Excel工作表,包含以下列:
A
B
C
D
E
F
日期
產品ID
產品名稱
區域
銷售量
單價
2021/1/1
1001
蘋果
北部
120
10
2021/1/1
1002
香蕉
南部
150
5
2021/1/1
1003
橙子
東部
200
8
…
…
…
…
…
…
複雜函數案例實作
1. INDEX 和 MATCH 函數組合
目的:查找特定產品在特定日期的銷售量。
公式:=INDEX(E2:E100, MATCH(1, (A2:A100="2021/1/1")*(B2:B100=1002), 0))
解釋:這個公式組合用於在給定條件下查找數據。MATCH 函數定位符合特定條件的行,INDEX 函數則從該行提取銷售量。
2. SUMIF 和 SUMIFS 函數
目的:基於單一條件或多重條件計算銷售總額。
公式:
單一條件:=SUMIF(D2:D100, "北部", E2:E100)
多重條件:=SUMIFS(E2:E100, D2:D100, "北部", B2:B100, 1001)
解釋:SUMIF 函數用於計算符合單一條件的數值總和,而 SUMIFS 可以同時基於多個條件計算總和。
3. COUNTIF 和 COUNTIFS 函數
目的:計算符合特定條件的數據數量。
公式:
單一條件:=COUNTIF(D2:D100, "北部")
多重條件:=COUNTIFS(D2:D100, "北部", B2:B100, 1001)
解釋:類似於SUMIF和SUMIFS,這些函數用於計算符合一個或多個條件的數據項目數量。
4. VLOOKUP 和 HLOOKUP 函數
目的:在相關表格中查找並返回數據。
公式:
垂直查找:=VLOOKUP(1001, A2:F100, 3, FALSE)
水平查找:=HLOOKUP("產品名稱", A1:F100, 2, FALSE)
解釋:VLOOKUP 函數用於垂直查找表格中的數據,而 HLOOKUP 用於水平查找。這些函數適用於從大型數據集中提取特定資訊。
資料科學和 Excel 有什麼關係?
資料科學是一種使用數據為基礎的科學,透過統計、機器學習等方法,以洞察出隱藏在數據中的訊息。在這個過程中,資料的整理、處理和視覺化扮演著關鍵的角色。這裡就是Excel進入場景的地方。
以下是Excel與資料科學的關聯:
資料清理與處理:大部分的資料科學專案開始於”髒數據”,這可能包含缺失值、錯誤值或異常值。Excel提供了一個直觀的介面和強大的功能,使得我們能夠輕鬆地對這些數據進行清理和處理。
資料分析與視覺化:Excel的功能如資料透視表、條件格式設定、圖表等,讓初步的資料探索和視覺化變得簡單。這對於理解數據分佈、發現潛在趨勢或異常點很有幫助。
相容性與普及度:Excel是許多企業和組織中最常用的工具之一,許多人都對它的操作有基本的了解。因此,使用Excel作為數據科學的一部分,能確保其他成員或者利害關係人能夠理解你的工作。
然而,儘管Excel在資料科學中有其優勢,但它也有其限制。對於大規模的數據集,Excel可能會面臨效能問題。此外,對於複雜的統計分析或機器學習模型,Excel可能無法提供足夠的支援。在這種情況下,資料科學家可能需要使用更專業的工具,如R或Python。
總的來說,Excel是資料科學的重要工具之一,特別是在資料的初步處理和分析階段。而學習如何在Excel中有效地處理和分析數據,對於想要進入資料科學領域的人來說,是一個重要的技能。
「數據思維」4 週進度班,帶你 5 步驟建立數據分析問題解決力