banner
达达里昂

达达里昂

🇳🇱 | Data Science | Finance | Open Source 没有记录就没有发生。
github

每週反思 24#4: 步履不停

照片由Giorgio Trovato拍摄,来源于Unsplash

本篇是对2024-01-212024-01-27这周生活的记录与思考。

春餅迎春#

熊小花的一位朋友周五來家裡做客,我們想着離立春挺近了。就張羅著做了春餅,配了魚香肉絲、蠔油杏鮑菇、酸辣土豆絲和涼拌包菜。其中,下廚房上魚香肉絲的配方完全,熊小花的涼拌包菜備受好評,主要得益於貴州的魏老媽辣椒面;下廚房上的這份魚香肉絲菜譜不僅味道出眾,而且所有的主要材料都可以在這邊買到,一餅解鄉愁。

雖然這只是我和熊貓老師第二次一起做春餅,但我們的合作已經非常成熟了。和面、發面、擀餅和烙餅,整個流水線作業,沒想到我這個在國內沒有怎麼吃春餅的人,竟然會在荷蘭自己做出來,也算是很特別的人生經歷了。

食物真是種特別的東西,在吃春餅的時候,突然想到某個回家的悠長午後,自己沒來由地走進一家春餅店中吃了一頓,當時吃的什麼已經完全記不得了,只記得在氤氳的蒸汽中嘈雜的人聲和在午後陽光下擦得閃亮的沾碟。

步履不停#

這周和熊小花一起看完了《請回答 1988》,這部劇集的獨特魅力在於可以用藏於細節的溫情激活觀眾角落的記憶,在淡淡的鄉愁中想象一種慢下來的生活。這種轉換,讓我想起了剛打開星露谷物語的那個遙遠的下午。熊培雲在《自由在高處》中,對此有過這樣的總結:

《舊金山紀事報》曾經嘲笑美國是個朝著微波爐大吼大叫,仍然嫌它速度太慢的民族。 不斷地更新換代同樣讓人們患上了 “喜新厭舊症”,“舊的不去,新的不來” 感染了社會上每一個人。正因如此,有人滿懷鄉愁 —— 如何回到原來的價值觀,長久地住在同一套房子裡,長久地保存重要的東西,並且彼此忠誠,這已經是稀有的生活。

整部劇集看下來,前半部分涉及父母生活的部分讓我們感觸最多。之前在國內的時候,雖然也不經常在父母身邊,但是總是會想自己有時間就會回去,即使回去的時間也並沒有那麼多。然而,出國之後,這種總可以相聚的心理預期已經消失,才能在真實的分別中,重新審視和家人的聯結。在這樣的情境下,這部劇恰當地提供了一個通向過去的入口,我在多處和劇情暗合的感覺中,發現了此前未被留意的家庭生活片段;同時,這部劇也提供了一個情感的出口,讓我們在懷念過去的時候,也更好得珍惜現在。去年在北京辦理完簽證事宜,從北京坐動車回家,在和鄰座的阿姨聊天中,她說到 “你還有父母可真好啊。”

而關於我接下來要講的那一天,其實也沒有發生什麼決定性的事件,我只是隱隱約約地感覺到,許多事情已經在水面下悄悄醞釀。但即便如此,我卻故意裝作什麼都不知道。直到我真的搞清楚的時候,我的人生已經往後翻了好幾頁,再也無法回頭挽救什麼。因為,那時,我已經失去了我的父母。—— 是枝裕和《步履不停》

寒假的尾巴#

距離開學只剩一周,自己心中沒有特別的激動,反而是日漸趨暖的天氣讓人感覺心情也一起開朗了起來。冬季昼短夜長,這在高緯地區尤其明顯,所以早起的燦爛陽光,總是帶來類似春天的錯覺,也因此驅散了漫漫長夜中的寒冷。

這一周內,自己主要完成 Master 的項目註冊和課程註冊。雖然 pre-master 的考試成績早早就放出來了,但是由於老師要等到 resit 才上傳成績,所以學校的系統此前一直沒有給自己 Enrollment Certificate。在將近一個月的等待後,老師終於上傳了成績,自己也正式註冊了 Master 項目。

語言課上,此前考慮到方便實習,自己沒有立即註冊課程。這周我想要再選修一門荷蘭語課,發現語言課的註冊已經關閉了,只能靠自學 + Duolingo 了,去年完成了 Duolingo 365 streak,希望這些底子可以讓自己的自學之路不那麼坎坷。

$1#

今年,給自己定了賺取 $1 被動收入的目標。

有天在回到家時,看到 youtube 推了在RapidAPI上部署簡單 API 服務的教程,看了一下,用的架構還是 Node.js 和 express.js,數據源獲取則使用cheerio進行爬取,最後部署到Heroku

這個項目本身沒有什麼難度,之後可以優化的點在於:

  • 數據存儲:目前的方案中,每次 request 都會發起一起爬蟲請求,一方面伺服器的壓力過大,且存在大量的性能浪費,另一方面在 request 數量上升後,容易觸發網站的反爬蟲策略,使得整個程序失效。之後自己部署的方案中,可以將爬蟲結果存儲在數據庫,目前考慮是之前用過的 MongoDB。

這個項目帶來的啟發是:

  • 了解 JavaScript 的爬蟲庫。之前我一直使用 BeatifulSoup 在 Python 中進行爬蟲,通過對 cheerio 庫的了解,全棧的技術有所提高(即,用 JavaScript 寫一切)。
  • API as a Service。之前在學習時,我主要從數據在前後端的傳輸理解 API,簡單地將後端的工作局限在數據庫。通過這個項目,我才發現 API 在輸入和輸出流中,提供服務的可能性。在The Top 50 Most Popular APIs這篇總結文章中,多數 API 提供的服務其實和數據庫無關,例如提供 TikTok 無水印下載的Tiktok Download Without WatermarkNLP Translation以及Article Data Extraction and Text Mining。這其中,機器學習的應用是個新的趨勢,使得複雜的模型可以通過標準的 API,應用到更多的場景。

Data Science#

這一周從此前一直主要投實習的節奏中切換回來,繼續在 DataCamp 上學習。

這周主要學了seaborn,並寫了一篇博客A Guide to the Power of hue in Seaborn Visualizations

這周還做了 DataCamp 上 Visualizing the History of Nobel Prize Winners 的項目,我驚訝於自己遺忘速度之快,很多基礎的切片操作學完不用就忘記了,之後每日的代碼練習還是需要繼續。

Weekly Gems#

Awesome DataScience#

  • QuantEcon是一份完整的關於用 Python 進行量化的教程,符合我未來 Financial Risk Management 的方向。

  • Colly是一個使用 Go 語言編寫的爬蟲庫,我完全沒有 Go 相關的知識,但是對於將 Elegant 放在 About 描述中的項目,讀一讀代碼也應該是愉悅的。

  • Neet Code是我在 Reddit 上發現的一個類 leetcode 網站,作者精選了 150 道題目,並附上了詳細的講解,可以增進對程序設計的理解。

web dev#

  • google-indexing-script通過Google Search Console APIWeb Search Indexing API,讀取網站 sitemap 並自動向 Google 推送尚未被收錄的網址。作者在項目介紹中說

    Use this script to get your entire site indexed on Google in less than 48 hours.

    我雖然嚴格按照作者的教程進行設置,但仍然發現作者漏掉了一些說明,之後準備寫一篇博客補充下。

  • 上一篇博客中,當我嘗試引用豆瓣讀書的圖片封面 url 時,發現豆瓣有防盜鏈設置,因此無法在我的網站上顯示,經過簡單的 Google,發現可以使用weserv.nl的服務進行中轉,繞開圖片引用的限制。

載入中......
此文章數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。