pyてよn日記

一寸先は闇が人生

2020-01-01から1年間の記事一覧

用語まとめ:zip,gzip,tar,tar.gz

基本 用語 アーカイバ,コンプレッサ 拡張子 圧縮,アーカイブに関する用語のまとめ. 基本 圧縮 ファイルサイズを小さくすること ファイル圧縮を行うソフトウェアをコンプレッサと呼ぶ. アーカイブ 複数のファイルを 1 つのファイルにまとめること.作成さ…

GitHub: Issue,Pull Request ベースの開発

issue,PR ベースの開発 Issue,PR ベースの利点 手順 1. GitHub 上で issue を立てる 2. issues/[issue number] でブランチを切り,空 commit & push 3. GitHub 上で PR を作成する 4. 実装する 5. 実装が終わったら WIP: prefix を除去してレビュー依頼 6.…

VSCode: Python + black で開発するための設定

black について pros cons VSCode の設定手順 1. black のインストール 2. black のパスを取得 3. VSCode 側で設定 GUI での設定 JSON での設定 参考 Python のコードフォーマッタ black を VSCode で使うための設定. github.com black について black の p…

Hatena SUMMER INTERNSHIP 2020 参加記

まとめ インターンまでの流れ インターンのスケジュール 全体の流れ 講義 インターンでの自分の動き 1 日目:講義 2-4 日目:課題 課題の内容,ブログサービスの構成 実装 5 日目:成果発表 インターンを通してできたこと,できなかったこと 他のインターン…

統計的推測の考え方

母集団,標本 統計的推測のアウトプット 確率変数,確率分布,母集団分布 統計的推測の目的は「母集団分布の性質の推測」 母集団分布の性質を「何で」推測するか 母集団分布の性質の推測:導入 母集団の性質の推測:母集団分布に既知の確率分布を仮定する パ…

【スライドの写経記事】データ基盤の全体像:「Data Platform Guide - 事業を成長させるデータ基盤を作るには」の写経

キーワード 1. データ基盤とは,なぜデータ基盤が必要か DataOps データ基盤とは データ基盤はなぜ必要か 2. データ基盤には何が必要か:データ基盤の構成要素 手軽にデータを参照できるツール 安全にデータを受け渡せるシステム データの階層を分ける - デ…

Mac OS で R,RStudio のインストール & Bioconductor のパッケージを使えるようにする

開発環境 インストール手順 1. Homebrew Cask で R のインストール 2. Homebrew Cask で RStudio のインストール 3. R を起動しパッケージのインストール 3. R を起動しパッケージのインストール(コマンドのみ) Rcmdr の読み込み 補足:CRAN と Bioconduct…

おれが住みたい家の条件 - 一人暮らし編

筆者の情報 スペック 現在の家 住居に求めるもの 住居に求める条件 必須条件 出来れば欲しい条件 住んでみたい場所(都内) 住んでみたい場所(都内以外) 終わりに 頭の中にある自分が住みたい家の条件を洗い出してみました.こんな条件はどう?ってのがあ…

ポリモーフィズムとは

Summary 調べる前の理解:ポリモーフィズム,ジェネリクス ポリモーフィズム ポリモーフィズム基本 ポリモーフィズムの分類 ポリモーフィズムの分類:説明 ポリモーフィズムの分類:実装 アドホック多相 パラメータ多相 サブタイピング多相 ジェネリクス 色…

Python:YAML <-> Python オブジェクト <-> JSON の相互変換

本記事の目標 開発環境 実行環境 使用ツール YAML の基本 key: value <-> 辞書型 - key: value <-> リスト型 YAML ファイル内でのコメント 改行 インデント サンプルを見てみる:docker-compose.yml 注意:本記事での用語の扱い方 実践例 ネストなし YAML <-…

正規表現チートシート

開発環境 参考リンク 正規表現一覧 基本的な正規表現 定義済みの正規表現 特定の位置関係の正規表現(まだ理解していない) 置換文字列で使える表現 メタ文字のエスケープ '^' という文字を含まない文字列 簡易サンプル集 アルファベット小文字,大文字のみ …

Python:unittest のドキュメント(mock 以外)を全部読んで整理してみた

本記事の目標 TL;DR unittest モジュールで出てくる概念 unittest の基本 基本的な使い方 落ちるテストケースを書いてみる 目次 コマンドラインインターフェース モジュール単位,クラス単位,個別のテストメソッド単位のテストの実行 コマンドラインオプシ…

Python:memory-profiler によるメモリ使用量のプロファイリング,可視化

開発環境 インストール メモリ使用量のプロファイリング シェルから実行 memory_profiler.profile デコレータを用いて,特定の関数を行ごとにプロファイリング mprof を用いて,メモリ使用量の経時変化を描画する IPython から実行 プロファイラでガベージコ…

Python:ガベージコレクションが行われるタイミング

python で GC が行われるタイミング オブジェクトの参照を切る 変数を del 文で消去し,「最後の」参照を切る 標準モジュール gc を用いて手動で GC を行う 終わりに Python では,言語処理系(CPython)の機能として実装されている「ガベージコレクション」…

Python:Pandas チートシート

各種参考リンク 表形式のデータの構成要素 Pandas の主要なデータ型:pd.Series と pd.DataFrame 基本 Pandas を用いてデータを作る pd.Series 基本 リスト,辞書,np.ndarray から pd.Series を作る pd.DataFrame 基本 np.ndarray から作る 辞書から作る co…

direnv の使い方

direnv とは 筆者の開発環境 インストール 基本的な使い方 デモ 1:基本的な使い方 エラー処理:direnv が実行できない時 デモ 2:Python の venv と組み合わせる 注意点:alias と関数は読み込まれない 終わりに いずれ読みたい 開発環境に direnv を導入し…

ソフトウェア開発における「ベンダリング vendoring」という概念

ベンダリングとは ベンダリングの利点 ベンダリングの例:Poetry のインストーラ 終わりに ソフトウェア開発で出てくる「ベンダリング vendoring」という言葉についてまとめた(英語では vendoring の他,vendorizing などと呼ばれるが,vendorizing の検索…

Git でコミットする時のルールを言語化してみた

概要 本記事の目標 注意 コミットする時のルール コミットメッセージの言語 コミットメッセージのフォーマット コミットの種類の分類と prefix ファイル,ライブラリの追加・消去に関する prefix 3 つ ユーザが利用する機能の追加・修正に関する prefix 4 つ…