Tenestegruppemøte: Respons

Tenestegruppemøte med respons som tema. Vår respons på henvendingar, og vår respons ved feil i Cerebrum.

Tilstades

  • estephaz
  • tvl
  • kv
  • fhl
  • tgk
  • jbr
  • jsama
  • sgs
  • hamar
  • elisabhs
  • hanskfje
  • jokim (ref)

Sak 1: 14:00: Saksbehandlingsrutiner [diskusjon]

Det er laga utkast til rutiner for saksbehandlinga i Cerebrum. Vi går gjennom utkastet og diskuterer.

Det er også laga Dashboards i RT for å følge med på dette. Ein per ukevakt, og ein for oppfølging frå dei ansvarlege (Hans Kristian og Elisabeth).

RT inkluderer enkle grafar for KPI.

Diskusjon

Kom ein del spørsmål rundt ny Cerebrum-avtale. Joakim har berre sett på utkast, så er opp til Hans Kristian. Vart løfta nokre problemstillingar, som:

  • Korleis definerer vi oppetid for Cerebrum?
  • Korleis vil det fungere om Cerebrum går ned utanfor kjernetid, eller på natt/helg?

Oppfølging

Enighet om utkast. Innfører frå no av.

Joakim justerer RT dashboards til å bruke Stalled for "stille lukking" av saker.

Sak 2: 14:20: Handtering av feil [diskusjon]

Initiativ frå Jonas: Diskusjon rundt feilhandteringa til Cerebrum.

  • Har vi gode nok rutiner for å oppdage feil?
  • Reagerer vi raskt nok på feil, og før andre merker at noe er galt og tar kontakt?
  • Er ELK godt nok til å oppdage og følge opp feil og advarsler?
  • Kan Sentry (https://sentry.io) fungere som verktøy for dette?

Jonas demonstrerer bruk av Sentry frå Studentersamfundet, før vi tek ein diskusjon rundt feilhandteringa til Cerebrum.

Diskusjon

Diskuterte ein del. Problemstillingar som kom opp:

  • Kor mykje av dette kan ELK og Zabbix løyse, som vi ikkje bruker?
  • Kanskje det er meir eit verktøy for utviklarane sjølve? At utviklarane følger med på kodefeil fortløpande.
  • Treng vi endre grensegangen mellom drift og utvikling? Kva skal drift følge med på, og skal utviklarane følge med på feil fortløpande?

Cerebrum si logging er overmoden for å bli fiksa på. Loggnivå spesielt, som gjer at drift drukner i loggar. Ein teneste som Sentry vil tvinge oss til å fikse på dete.

Konklusjon: Tenestegruppa ønsker sette opp Sentry som ein liten test, men for utviklarane i første omgang. INT set den opp, og integrerer logginga frå nokre få Cerebrum-tenester, så henter vi erfaringar frå det, før vi evt. utvider til heile Cerebrum og alle dei andre produkta våre. På sikt kan vi vurdere å inkludere Sentry i driftsopplegget, om det viser seg å passe. Det kan også vere aktuelt for tenestegruppa for utvikling og drift, som eit felles verktøy.

Oppfølging

Joakim bestiller frå INT å få satt opp Sentry som test, helst allereie i neste sprint. (ref.anm: Etter møtet vart INT-168 oppretta for dette)

Eventuelt

Publisert 21. nov. 2017 13:55 - Sist endret 27. nov. 2017 12:02