2022-01-01から1年間の記事一覧
Anews について 業界別2022年のキーフレーズ キーフレーズの抽出 キーフレーズのスコアリング さいごに 参考文献 本記事は、Stockmark Advent Calendar 2022 の 12 日目の記事です。 年の瀬といえば流行語大賞ですね。今年 2022 年も 大谷ルール や オミクロ…
はじめに 自然言語処理とは 構造化事例: 定義文抽出 定義文のニーズ 定義文抽出の流れ 抽出結果 今後の展望 記事の出典 はじめに こんにちは、Researcherの北山です。今回は自然言語処理技術を用いてAstrategyにおける顧客体験向上のための取り組みを行った…
スキーマ駆動による開発効率化 Over Fetching を生み出さないAPI設計 価値のベースラインを保つリグレッションテスト 継続的なライブラリバージョンのメンテナンス CIは命綱 「推測するな、計測せよ」によるユーザー体験の向上 まとめ ストックマーク Co-VPo…
はじめに なぜ Node.js なのか? なぜ AWS Lambdaなのか? Lambda x Node.js でスクレイピングする際の落とし穴 落とし穴 その1: Puppeteer がクラッシュする 落とし穴 その2: Lambdaが最大並列実行数に到達しない 落とし穴 その3: 巨大なXMLの存在 落とし穴 …
先に実物を紹介 プレスリリース駆動開発を起因とした3つの変化 1. 顧客のアトラクト強化 2. プロダクトオーナー自身の気づきによる新機能の洗練化 3. より効果的な画像が作成できるように まとめ ストックマークではプロダクト開発の方法として、プレスリリ…
概要 背景:GitHubのブランチ戦略がチームスケールの弊害に 変更前の運用:コンフリクトと調整コストのトレードオフ 変更後の運用:ブランチ戦略見直しとFeature Flagの導入 今後に向けて 概要 組織の拡大に伴う開発チームの分割、独立性向上のためにGitHub…
ストックマークのプロダクトはデータに支えられている 「何もしてないのに壊れる」のではなく「何もしてないと壊れる」 Phase0: どちらのプロダクトが対応する? Phase1: 役割の一部を明確化 Phase2: データチームの切り出しへ Phase3: データプラットフォー…
ニュースタイトル分類タスクでの実験 英語での fine-tuning の効果 クラス別の精度評価 NAC での degradation おわりに 引用 Appendix: モデルの設定 グローバル化が進む現代において、様々な言語で情報収集を行う必要性がこれまで以上に高まっています。Sto…
はじめに 類似性グラフの構築 グラフの構成要素の抽出 バッチ計算 まとめ 本記事は Grouping Similar Articles with Search Engine More-Like-This Queries and Graph Algorithms の翻訳記事です。以前の記事である More Like This Query を活用した類似記事…
Introduction Building Similarity Graph Extracting Graph Components Batch computations Concluding Remarks Please refer here for a related post in Japanese. Introduction In Stockmark, we collect tens of thousands of news articles from thousa…
はじめに 類似記事集約がなぜ必要なのか? どうやって実装しているのか? More Like This Query のロジック 過去記事への再適用は大変… まとめと記事予告(ストックマーク独自の工夫) はじめに 本記事では、ストックマークのプロダクトの実装で工夫している類…
ボケて電笑戦とは お笑いモデルの構築 教師データの準備 教師データの前処理 画像の前処理 テキストの前処理 お笑いモデルの構成と学習 お笑いモデルの構成 お笑いモデルの学習 生成したボケの後処理 生成したボケの評価 学習データにビジネスニュースを入れ…